語料過濾方法與裝置

基本信息

申請?zhí)?/td> CN201811241741.3 申請日 -
公開(公告)號 CN109376224B 公開(公告)日 2019-02-22
申請公布號 CN109376224B 申請公布日 2019-02-22
分類號 G06F16/332(2019.01)I 分類 -
發(fā)明人 況鵬;左靖東 申請(專利權)人 深圳市壹鴿科技有限公司
代理機構 北京超凡志成知識產權代理事務所(普通合伙) 代理人 深圳市壹鴿科技有限公司
地址 518000廣東省深圳市南山區(qū)粵海街道高新區(qū)科苑路東白石路北高新技術工業(yè)村T3棟B3
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種語料過濾方法與裝置,涉及語音識別領域。該語料過濾方法與裝置,通過接收語音客服機器人發(fā)送的原始話輪語料;然后將原始話輪語料轉化文本字符集合,將文本字符集合劃分為單字語料集合和詞句語料集合;最后將單字語料集合中未包含于預建立的有意義字表的話輪語料進行過濾、將詞句語料集合中包含有預建立的非自然語音關鍵詞表的負關鍵詞的話輪語料進行過濾,通過不正常的語音進行過濾,實現(xiàn)了非自然語音的拒識別,提高了語音識別的正確率,以及提高了對在噪聲環(huán)境下魯棒的語音識別性能的魯棒性、極大地提高了用戶的交互體驗。??