消除新聞中行業(yè)詞歧義的方法、裝置、設(shè)備和存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202110590171.4 | 申請日 | - |
公開(公告)號 | CN113407717A | 公開(公告)日 | 2021-09-17 |
申請公布號 | CN113407717A | 申請公布日 | 2021-09-17 |
分類號 | G06F16/35(2019.01)I;G06F16/36(2019.01)I;G06F40/216(2020.01)I;G06F40/247(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 賈寧 | 申請(專利權(quán))人 | 數(shù)庫(上海)科技有限公司 |
代理機(jī)構(gòu) | 上海十蕙一蘭知識產(chǎn)權(quán)代理有限公司 | 代理人 | 劉秋蘭 |
地址 | 201112上海市閔行區(qū)陳行路2388號9號樓8層801室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明屬于數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及一種消除新聞中行業(yè)詞歧義的方法、裝置、設(shè)備和存儲介質(zhì)。其中方法包括:獲取新聞,對新聞進(jìn)行行業(yè)分類,得到行業(yè)標(biāo)簽分類結(jié)果;對行業(yè)標(biāo)簽分類結(jié)果進(jìn)行標(biāo)簽共現(xiàn)檢驗(yàn),若檢驗(yàn)未通過,則將全部的行業(yè)標(biāo)簽加入歧義判別列表中,若檢驗(yàn)通過,則將存在歧義詞集合中的特征詞對應(yīng)的行業(yè)標(biāo)簽加入歧義判別列表中,若不存在,則直接輸出結(jié)果;通過預(yù)設(shè)的歧義判別模型對歧義判別列表中的行業(yè)標(biāo)簽進(jìn)行判別,得到歧義判別結(jié)果,根據(jù)歧義判別結(jié)果進(jìn)行輸出。本發(fā)明擺脫了對歧義詞表或知識圖譜的重度依賴,可以自動發(fā)現(xiàn)歧義詞表之外的歧義詞帶來的錯誤,大大減少了開發(fā)成本。 |
