一種基于視頻語音的人物識別方法、裝置、設(shè)備和介質(zhì)
基本信息
申請?zhí)?/td> | CN201810798832.0 | 申請日 | - |
公開(公告)號 | CN108882033A | 公開(公告)日 | 2018-11-23 |
申請公布號 | CN108882033A | 申請公布日 | 2018-11-23 |
分類號 | H04N21/4415;H04N21/439;G06K9/00;G06F17/27 | 分類 | 電通信技術(shù); |
發(fā)明人 | 宋旭博 | 申請(專利權(quán))人 | 上海影譜科技有限公司 |
代理機構(gòu) | 北京萬思博知識產(chǎn)權(quán)代理有限公司 | 代理人 | 北京影譜科技股份有限公司;上海影譜科技有限公司 |
地址 | 100000 北京市朝陽區(qū)朝外大街22號5層521室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了一種基于視頻語音的人物識別方法、裝置、設(shè)備和介質(zhì)。該方法包括:識別視頻中出現(xiàn)的人物的面部圖像,基于所述面部圖像確定該人物的身份信息,得到第一身份信息集合,其中,所述第一身份集合至少包括一個身份信息;基于對與所述視頻對應(yīng)的音頻進行檢測得到的人物姓名列表,對所述第一身份信息集合進行過濾,得到第二身份信息集合。通過該方法,能夠?qū)⑷宋镱^像識別和音頻信息相結(jié)合,利用語音識別出的人名信息輔助識別人物身份,從而能夠區(qū)分長相接近的演員,在遠景鏡頭人物頭像模糊的情況下,能夠提高識別的準(zhǔn)確性,減少無法識別和錯誤識別的情況。 |
