一種有效語(yǔ)音識(shí)別方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201710573521.X | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN107369449B | 公開(kāi)(公告)日 | 2019-11-26 |
申請(qǐng)公布號(hào) | CN107369449B | 申請(qǐng)公布日 | 2019-11-26 |
分類(lèi)號(hào) | G10L15/26;G10L21/0208;G10L21/0272;G06K9/00 | 分類(lèi) | 樂(lè)器;聲學(xué); |
發(fā)明人 | 蔣化冰;蔡漢嘉;廖凱;齊鵬舉;方園;米萬(wàn)珠;舒劍;吳琨;管偉;羅璇 | 申請(qǐng)(專(zhuān)利權(quán))人 | 諾亞機(jī)器人科技(上海)有限公司 |
代理機(jī)構(gòu) | 上海碩力知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 郭桂峰 |
地址 | 200335 上海市長(zhǎng)寧區(qū)廣順路33號(hào)2幢402室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實(shí)施例提供一種有效語(yǔ)音識(shí)別的方法及裝置,所述方法包括:記錄聲源對(duì)象的語(yǔ)音數(shù)據(jù),同時(shí)獲取所述聲源對(duì)象的臉部圖像數(shù)據(jù);對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行ASR識(shí)別,獲得ASR識(shí)別結(jié)果,所述ASR識(shí)別結(jié)果包括若干條語(yǔ)音內(nèi)容及對(duì)應(yīng)的語(yǔ)音記錄時(shí)間點(diǎn);對(duì)所述聲源對(duì)象的臉部圖像數(shù)據(jù)進(jìn)行張口特征識(shí)別,獲得若干幀張口圖像和所述每幀張口圖像對(duì)應(yīng)的圖像獲取時(shí)間點(diǎn);以及,比對(duì)所述每條語(yǔ)音內(nèi)容對(duì)應(yīng)的語(yǔ)音記錄時(shí)間點(diǎn)的前后預(yù)設(shè)時(shí)間范圍內(nèi),是否有相應(yīng)的張口圖像的圖像獲取時(shí)間點(diǎn)在此范圍內(nèi);若有,記錄對(duì)應(yīng)的語(yǔ)音內(nèi)容為有效語(yǔ)音。通過(guò)本方法及裝置,能夠從ASR識(shí)別結(jié)果中識(shí)別有效的語(yǔ)音數(shù)據(jù),有效提高ASR識(shí)別結(jié)果的應(yīng)用價(jià)值。 |
