一種基于視頻語音的人物識別方法、裝置、設(shè)備和介質(zhì)

基本信息

申請?zhí)?/td> CN201810798832.0 申請日 -
公開(公告)號 CN108882033A 公開(公告)日 2018-11-23
申請公布號 CN108882033A 申請公布日 2018-11-23
分類號 H04N21/4415;H04N21/439;G06K9/00;G06F17/27 分類 電通信技術(shù);
發(fā)明人 宋旭博 申請(專利權(quán))人 上海影譜科技有限公司
代理機構(gòu) 北京萬思博知識產(chǎn)權(quán)代理有限公司 代理人 北京影譜科技股份有限公司;上海影譜科技有限公司
地址 100000 北京市朝陽區(qū)朝外大街22號5層521室
法律狀態(tài) -

摘要

摘要 本申請公開了一種基于視頻語音的人物識別方法、裝置、設(shè)備和介質(zhì)。該方法包括:識別視頻中出現(xiàn)的人物的面部圖像,基于所述面部圖像確定該人物的身份信息,得到第一身份信息集合,其中,所述第一身份集合至少包括一個身份信息;基于對與所述視頻對應(yīng)的音頻進行檢測得到的人物姓名列表,對所述第一身份信息集合進行過濾,得到第二身份信息集合。通過該方法,能夠?qū)⑷宋镱^像識別和音頻信息相結(jié)合,利用語音識別出的人名信息輔助識別人物身份,從而能夠區(qū)分長相接近的演員,在遠景鏡頭人物頭像模糊的情況下,能夠提高識別的準(zhǔn)確性,減少無法識別和錯誤識別的情況。