一種語音與圖像的匹配方法、裝置、存儲介質(zhì)及設(shè)備

基本信息

申請?zhí)?/td> CN202110733632.9 申請日 -
公開(公告)號 CN113506578A 公開(公告)日 2021-10-15
申請公布號 CN113506578A 申請公布日 2021-10-15
分類號 G10L17/22(2013.01)I;G10L15/22(2006.01)I;G10L15/25(2013.01)I;G06K9/00(2006.01)I;G10L15/26(2006.01)I 分類 樂器;聲學(xué);
發(fā)明人 李豐軍;周劍光;李婷婷 申請(專利權(quán))人 中汽創(chuàng)智科技有限公司
代理機(jī)構(gòu) 廣州三環(huán)專利商標(biāo)代理有限公司 代理人 郝傳鑫;賈允
地址 211100江蘇省南京市江寧區(qū)秣陵街道勝利路88號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種語音與圖像的匹配方法、裝置、存儲介質(zhì)及設(shè)備,包括實(shí)時(shí)錄音獲得語音記錄;響應(yīng)于拍攝指令,拍照并輸出圖像;對所述圖像進(jìn)行人像識別,得到第一識別結(jié)果;其中,所述第一識別結(jié)果至少包括對所述圖像中人像數(shù)量的識別;從所述語音記錄中選取解析段,對所述解析段中的語音進(jìn)行語音解析得到第二識別結(jié)果;其中,所述第二識別結(jié)果至少包括對所述語音記錄中人像數(shù)量的識別;自動匹配所述第一識別結(jié)果與所述第二識別結(jié)果得到匹配關(guān)系,根據(jù)所述匹配關(guān)系合成帶有語音的圖像。本發(fā)明能夠精確實(shí)現(xiàn)語音中聲紋與圖像中人像的自動識別與自動匹配,智能化地快速合成帶有語音的圖像,精確度高,方便快速,用戶體驗(yàn)感受好。