中文企業(yè)名稱的識別方法
基本信息
申請?zhí)?/td> | CN201510614480.5 | 申請日 | - |
公開(公告)號 | CN105320645B | 公開(公告)日 | 2019-07-12 |
申請公布號 | CN105320645B | 申請公布日 | 2019-07-12 |
分類號 | G06F17/27 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 宋傳寶;史墨軒;郝靜 | 申請(專利權(quán))人 | 天津海量信息技術(shù)股份有限公司 |
代理機構(gòu) | 天津市尚文知識產(chǎn)權(quán)代理有限公司 | 代理人 | 天津海量信息技術(shù)股份有限公司 |
地址 | 300020 天津市和平區(qū)南馬路11號麥購國際大廈23層 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種中文企業(yè)名稱的識別方法,包括以下步驟:建立企業(yè)名稱知識庫和企業(yè)名稱概率知識庫,企業(yè)名稱知識庫中包括地名詞集、企業(yè)通名詞集、行業(yè)飾名詞集和企業(yè)專名禁止詞集,企業(yè)名稱概率知識庫中包括企業(yè)名稱左鄰詞概率知識和企業(yè)名稱左鄰詞概率知識;掃描文本,對文本進行分詞;分別完成以地名飾名開頭的企業(yè)名稱識別和無地名飾名開頭的企業(yè)名稱識別。利用本發(fā)明所述的中文企業(yè)名稱的識別方法可以加快文檔識別中的速度,且提高了企業(yè)名稱識別的準確率。 |
