基于音節(jié)驅(qū)動(dòng)的音譯實(shí)體名的計(jì)算機(jī)自動(dòng)識(shí)別方法
基本信息
申請(qǐng)?zhí)?/td> | CN200710166174.5 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN101145166A | 公開(公告)日 | 2008-03-19 |
申請(qǐng)公布號(hào) | CN101145166A | 申請(qǐng)公布日 | 2008-03-19 |
分類號(hào) | G06F17/30(2006.01) | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 陳沛;郭永福;許歡慶 | 申請(qǐng)(專利權(quán))人 | 北京中搜在線軟件有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 100088北京市海淀區(qū)西直門北大街42號(hào)華星大廈A座13層 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種基于音節(jié)驅(qū)動(dòng)的音譯實(shí)體名的計(jì)算機(jī)自動(dòng)識(shí)別方法,包括用于計(jì)算機(jī)檢索的音譯名,先獲原始可信音譯名庫(kù);再構(gòu)建用于識(shí)別音譯實(shí)體名的音節(jié)信息庫(kù);組成大容量的音譯名語(yǔ)料庫(kù);以原始可信音譯名庫(kù)的音譯名為基礎(chǔ)統(tǒng)計(jì)識(shí)別音譯名出現(xiàn)的錯(cuò)誤類別,修正該音譯名語(yǔ)料庫(kù),利用該音譯名語(yǔ)料庫(kù)對(duì)音譯實(shí)體名進(jìn)行自動(dòng)識(shí)別。本發(fā)明充分利于音譯名用字的構(gòu)成規(guī)律,對(duì)計(jì)算機(jī)自動(dòng)識(shí)別的對(duì)比音譯名語(yǔ)料庫(kù)進(jìn)行漸進(jìn)式整理,分析提高了識(shí)別精度,并通過音節(jié)的統(tǒng)計(jì)學(xué)習(xí)得到計(jì)算機(jī)識(shí)別精度更高的音譯名資料庫(kù),從而建立大型的高精準(zhǔn)度音譯名資料庫(kù)并提高搜索中音譯名識(shí)別精度的,大大降低的音譯名實(shí)體搜索工程中錯(cuò)誤的觸發(fā)幾率和邊界識(shí)別錯(cuò)誤的幾率。 |
