中文企業(yè)名稱的識別方法

基本信息

申請?zhí)?/td> CN201510614480.5 申請日 -
公開(公告)號 CN105320645B 公開(公告)日 2019-07-12
申請公布號 CN105320645B 申請公布日 2019-07-12
分類號 G06F17/27 分類 計算;推算;計數(shù);
發(fā)明人 宋傳寶;史墨軒;郝靜 申請(專利權(quán))人 天津海量信息技術(shù)股份有限公司
代理機構(gòu) 天津市尚文知識產(chǎn)權(quán)代理有限公司 代理人 天津海量信息技術(shù)股份有限公司
地址 300020 天津市和平區(qū)南馬路11號麥購國際大廈23層
法律狀態(tài) -

摘要

摘要 一種中文企業(yè)名稱的識別方法,包括以下步驟:建立企業(yè)名稱知識庫和企業(yè)名稱概率知識庫,企業(yè)名稱知識庫中包括地名詞集、企業(yè)通名詞集、行業(yè)飾名詞集和企業(yè)專名禁止詞集,企業(yè)名稱概率知識庫中包括企業(yè)名稱左鄰詞概率知識和企業(yè)名稱左鄰詞概率知識;掃描文本,對文本進行分詞;分別完成以地名飾名開頭的企業(yè)名稱識別和無地名飾名開頭的企業(yè)名稱識別。利用本發(fā)明所述的中文企業(yè)名稱的識別方法可以加快文檔識別中的速度,且提高了企業(yè)名稱識別的準確率。