一種基于語音識別的文本確定方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202010326878.X 申請日 -
公開(公告)號 CN111523327A 公開(公告)日 2020-08-11
申請公布號 CN111523327A 申請公布日 2020-08-11
分類號 G06F40/295(2020.01)I 分類 -
發(fā)明人 呂志堅;何余良;徐冠寧 申請(專利權(quán))人 北京市科學(xué)技術(shù)情報研究所
代理機(jī)構(gòu) 北京高沃律師事務(wù)所 代理人 北京市科學(xué)技術(shù)情報研究所;北京若本機(jī)器人科技有限公司
地址 100044北京市西城區(qū)西外大街140號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于語音識別的文本確定方法及系統(tǒng)。該方法包括獲取語音文件;根據(jù)所述語音文件生成第一文本;對所述第一文本進(jìn)行預(yù)處理;采用BERT算法提取所述預(yù)處理后的第一文本中的所有實體,得到實體集合;對所述實體集合中的所有實體采用注意力模型確定多個三元組;對所有所述三元組進(jìn)行重組,確定第二文本;所述第二文本為符合語法結(jié)構(gòu)的文本。本發(fā)明所提供得一種基于語音識別的文本確定方法及系統(tǒng),能夠提高通過語音識別生成的文本信息的可讀性。??