一種融合句子局部上下文與文檔領(lǐng)域信息的詞義消歧方法

基本信息

申請?zhí)?/td> CN201610033097.5 申請日 -
公開(公告)號 CN105740225B 公開(公告)日 2019-02-01
申請公布號 CN105740225B 申請公布日 2019-02-01
分類號 G06F17/27 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 鹿文鵬;孟凡擎;杜月寒 申請(專利權(quán))人 山東經(jīng)偉晟睿數(shù)據(jù)技術(shù)有限公司
代理機(jī)構(gòu) 濟(jì)南信達(dá)專利事務(wù)所有限公司 代理人 孫園園
地址 250001 山東省濟(jì)南市高新區(qū)新濼大街2008號銀荷大廈C座1002室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種融合句子局部上下文與文檔領(lǐng)域信息的詞義消歧方法,屬于自然語言處理技術(shù)領(lǐng)域。其步驟為:①對歧義詞所在的句子進(jìn)行依存句法分析,獲得與歧義詞具有直接依存關(guān)系的句子局部上下文相關(guān)詞;②對領(lǐng)域文檔集合進(jìn)行依存句法分析,收集其所包含的全部的依存元組,構(gòu)建依存元組庫;③對依存元組庫進(jìn)行統(tǒng)計(jì)分析,找到與歧義詞關(guān)系最為密切的一組領(lǐng)域相關(guān)詞;④根據(jù)領(lǐng)域相關(guān)詞的依存分布相似度及其與局部上下文的詞義相關(guān)度,確定其消歧權(quán)重;⑤將句子局部上下文相關(guān)詞和領(lǐng)域相關(guān)詞合并,構(gòu)建相關(guān)詞集合;⑥根據(jù)歧義詞的各個詞義與相關(guān)詞集合的加權(quán)累加相關(guān)度,判定正確詞義。本發(fā)明公開的方法能夠提高詞義消歧系統(tǒng)在特定領(lǐng)域上的適應(yīng)性,提高消歧正確率。