一種語音與圖像的匹配方法、裝置、存儲介質(zhì)及設(shè)備
基本信息
申請?zhí)?/td> | CN202110733632.9 | 申請日 | - |
公開(公告)號 | CN113506578A | 公開(公告)日 | 2021-10-15 |
申請公布號 | CN113506578A | 申請公布日 | 2021-10-15 |
分類號 | G10L17/22(2013.01)I;G10L15/22(2006.01)I;G10L15/25(2013.01)I;G06K9/00(2006.01)I;G10L15/26(2006.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 李豐軍;周劍光;李婷婷 | 申請(專利權(quán))人 | 中汽創(chuàng)智科技有限公司 |
代理機(jī)構(gòu) | 廣州三環(huán)專利商標(biāo)代理有限公司 | 代理人 | 郝傳鑫;賈允 |
地址 | 211100江蘇省南京市江寧區(qū)秣陵街道勝利路88號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種語音與圖像的匹配方法、裝置、存儲介質(zhì)及設(shè)備,包括實(shí)時(shí)錄音獲得語音記錄;響應(yīng)于拍攝指令,拍照并輸出圖像;對所述圖像進(jìn)行人像識別,得到第一識別結(jié)果;其中,所述第一識別結(jié)果至少包括對所述圖像中人像數(shù)量的識別;從所述語音記錄中選取解析段,對所述解析段中的語音進(jìn)行語音解析得到第二識別結(jié)果;其中,所述第二識別結(jié)果至少包括對所述語音記錄中人像數(shù)量的識別;自動匹配所述第一識別結(jié)果與所述第二識別結(jié)果得到匹配關(guān)系,根據(jù)所述匹配關(guān)系合成帶有語音的圖像。本發(fā)明能夠精確實(shí)現(xiàn)語音中聲紋與圖像中人像的自動識別與自動匹配,智能化地快速合成帶有語音的圖像,精確度高,方便快速,用戶體驗(yàn)感受好。 |
