唇語的分詞方法、裝置、存儲(chǔ)介質(zhì)和電子設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN201810586014.4 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN110580336A | 公開(公告)日 | 2019-12-17 |
申請(qǐng)公布號(hào) | CN110580336A | 申請(qǐng)公布日 | 2019-12-17 |
分類號(hào) | G06F17/27(2006.01); G06K9/00(2006.01); G06K9/46(2006.01) | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 劉純平; 季怡; 林欣; 邢騰飛; 鄔曉鈞 | 申請(qǐng)(專利權(quán))人 | 北京得意音通技術(shù)有限責(zé)任公司 |
代理機(jī)構(gòu) | 北京天健君律專利代理事務(wù)所(普通合伙) | 代理人 | 北京得意音通技術(shù)有限責(zé)任公司 |
地址 | 100085 北京市海淀區(qū)雙清路77號(hào)院4號(hào)樓9層901 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實(shí)施例提供一種唇語的分詞方法、裝置、存儲(chǔ)介質(zhì)和電子設(shè)備,涉及人工智能領(lǐng)域。其中,所述方法包括:從說話者說話的視頻幀序列中,獲取視頻幀序列中至少一個(gè)視頻幀圖像的唇部特征點(diǎn);基于至少一個(gè)視頻幀圖像的唇部特征點(diǎn),確定至少一個(gè)視頻幀圖像中每個(gè)視頻幀圖像的唇部動(dòng)作特征數(shù)據(jù);確定至少一個(gè)視頻幀圖像中視頻幀圖像的唇部動(dòng)作特征數(shù)據(jù)的正向標(biāo)準(zhǔn)差和/或逆向標(biāo)準(zhǔn)差;基于至少一個(gè)視頻幀圖像中視頻幀圖像的唇部動(dòng)作特征數(shù)據(jù)的正向標(biāo)準(zhǔn)差和/或逆向標(biāo)準(zhǔn)差,確定說話者的唇語的分詞結(jié)果。通過本發(fā)明實(shí)施例,基于視頻幀圖像的唇部動(dòng)作特征數(shù)據(jù)的正向標(biāo)準(zhǔn)差和逆向標(biāo)準(zhǔn)差,確定說話者的唇語的分詞結(jié)果,能夠提高說話者的唇語分詞的準(zhǔn)確度。 |
