一種融合句子局部上下文與文檔領域信息的詞義消歧方法

基本信息

申請?zhí)?/td> CN201610033097.5 申請日 -
公開(公告)號 CN105740225A 公開(公告)日 2016-07-06
申請公布號 CN105740225A 申請公布日 2016-07-06
分類號 G06F17/27 分類 計算;推算;計數(shù);
發(fā)明人 鹿文鵬;孟凡擎;杜月寒 申請(專利權(quán))人 山東經(jīng)偉晟睿數(shù)據(jù)技術(shù)有限公司
代理機構(gòu) - 代理人 -
地址 250001 山東省濟南市高新區(qū)新濼大街2008號銀荷大廈C座1002室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種融合句子局部上下文與文檔領域信息的詞義消歧方法,屬于自然語言處理技術(shù)領域。其步驟為:①對歧義詞所在的句子進行依存句法分析,獲得與歧義詞具有直接依存關系的句子局部上下文相關詞;②對領域文檔集合進行依存句法分析,收集其所包含的全部的依存元組,構(gòu)建依存元組庫;③對依存元組庫進行統(tǒng)計分析,找到與歧義詞關系最為密切的一組領域相關詞;④根據(jù)領域相關詞的依存分布相似度及其與局部上下文的詞義相關度,確定其消歧權(quán)重;⑤將句子局部上下文相關詞和領域相關詞合并,構(gòu)建相關詞集合;⑥根據(jù)歧義詞的各個詞義與相關詞集合的加權(quán)累加相關度,判定正確詞義。本發(fā)明公開的方法能夠提高詞義消歧系統(tǒng)在特定領域上的適應性,提高消歧正確率。