公司名稱的提取方法、裝置和計(jì)算機(jī)可讀介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN201810509265.2 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN108733828B 公開(kāi)(公告)日 2018-11-02
申請(qǐng)公布號(hào) CN108733828B 申請(qǐng)公布日 2018-11-02
分類號(hào) G06F16/903(2019.01)I;G06F16/33(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 朱寶旭;柳超 申請(qǐng)(專利權(quán))人 北京天眼查科技有限公司
代理機(jī)構(gòu) 北京超凡志成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 北京金堤科技有限公司;北京天眼查科技有限公司
地址 100000北京市海淀區(qū)知春路63號(hào)中國(guó)衛(wèi)星通信大廈東塔20層2001
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種公司名稱的提取方法、裝置和計(jì)算機(jī)可讀介質(zhì),涉及數(shù)據(jù)處理的技術(shù)領(lǐng)域,包括獲取待匹配的倒序文本,并在倒序文本中確定待匹配文字;從待匹配文字選擇前N個(gè)文字,并沿著目標(biāo)前綴樹(shù)的第一路徑將前N個(gè)文字與目標(biāo)前綴樹(shù)進(jìn)行匹配,其中,第一路徑中包括用于表征公司類型的多個(gè)節(jié)點(diǎn);如果匹配成功,則沿著第二路徑將待匹配文字中位于前N個(gè)文字之后的文字與目標(biāo)前綴樹(shù)進(jìn)行匹配,并在匹配結(jié)束之后得到目標(biāo)字串;判斷目標(biāo)字串中最后一個(gè)文字在目標(biāo)前綴樹(shù)所對(duì)應(yīng)的節(jié)點(diǎn)是否為葉子節(jié)點(diǎn);如果是,則將目標(biāo)字串確定為公司名稱,本發(fā)明緩解了現(xiàn)有的公司名稱的提取方法速度慢,效率低的技術(shù)問(wèn)題。??