唇語的分詞方法、裝置、存儲(chǔ)介質(zhì)和電子設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN201810586014.4 申請(qǐng)日 -
公開(公告)號(hào) CN110580336A 公開(公告)日 2019-12-17
申請(qǐng)公布號(hào) CN110580336A 申請(qǐng)公布日 2019-12-17
分類號(hào) G06F17/27(2006.01); G06K9/00(2006.01); G06K9/46(2006.01) 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉純平; 季怡; 林欣; 邢騰飛; 鄔曉鈞 申請(qǐng)(專利權(quán))人 北京得意音通技術(shù)有限責(zé)任公司
代理機(jī)構(gòu) 北京天健君律專利代理事務(wù)所(普通合伙) 代理人 北京得意音通技術(shù)有限責(zé)任公司
地址 100085 北京市海淀區(qū)雙清路77號(hào)院4號(hào)樓9層901
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例提供一種唇語的分詞方法、裝置、存儲(chǔ)介質(zhì)和電子設(shè)備,涉及人工智能領(lǐng)域。其中,所述方法包括:從說話者說話的視頻幀序列中,獲取視頻幀序列中至少一個(gè)視頻幀圖像的唇部特征點(diǎn);基于至少一個(gè)視頻幀圖像的唇部特征點(diǎn),確定至少一個(gè)視頻幀圖像中每個(gè)視頻幀圖像的唇部動(dòng)作特征數(shù)據(jù);確定至少一個(gè)視頻幀圖像中視頻幀圖像的唇部動(dòng)作特征數(shù)據(jù)的正向標(biāo)準(zhǔn)差和/或逆向標(biāo)準(zhǔn)差;基于至少一個(gè)視頻幀圖像中視頻幀圖像的唇部動(dòng)作特征數(shù)據(jù)的正向標(biāo)準(zhǔn)差和/或逆向標(biāo)準(zhǔn)差,確定說話者的唇語的分詞結(jié)果。通過本發(fā)明實(shí)施例,基于視頻幀圖像的唇部動(dòng)作特征數(shù)據(jù)的正向標(biāo)準(zhǔn)差和逆向標(biāo)準(zhǔn)差,確定說話者的唇語的分詞結(jié)果,能夠提高說話者的唇語分詞的準(zhǔn)確度。