語料過濾方法與裝置

基本信息

申請(qǐng)?zhí)?/td> CN201811241741.3 申請(qǐng)日 -
公開(公告)號(hào) CN109376224A 公開(公告)日 2019-02-22
申請(qǐng)公布號(hào) CN109376224A 申請(qǐng)公布日 2019-02-22
分類號(hào) G06F16/332;G10L15/26;G10L15/20 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 況鵬;左靖東 申請(qǐng)(專利權(quán))人 深圳市壹鴿科技有限公司
代理機(jī)構(gòu) 北京超凡志成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 深圳市壹鴿科技有限公司
地址 518000 廣東省深圳市南山區(qū)粵海街道高新區(qū)科苑路東白石路北高新技術(shù)工業(yè)村T3棟B3
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種語料過濾方法與裝置,涉及語音識(shí)別領(lǐng)域。該語料過濾方法與裝置,通過接收語音客服機(jī)器人發(fā)送的原始話輪語料;然后將原始話輪語料轉(zhuǎn)化文本字符集合,將文本字符集合劃分為單字語料集合和詞句語料集合;最后將單字語料集合中未包含于預(yù)建立的有意義字表的話輪語料進(jìn)行過濾、將詞句語料集合中包含有預(yù)建立的非自然語音關(guān)鍵詞表的負(fù)關(guān)鍵詞的話輪語料進(jìn)行過濾,通過不正常的語音進(jìn)行過濾,實(shí)現(xiàn)了非自然語音的拒識(shí)別,提高了語音識(shí)別的正確率,以及提高了對(duì)在噪聲環(huán)境下魯棒的語音識(shí)別性能的魯棒性、極大地提高了用戶的交互體驗(yàn)。