一種融合句子局部上下文與文檔領(lǐng)域信息的詞義消歧方法

基本信息

申請(qǐng)?zhí)?/td> CN201610033097.5 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN105740225A 公開(kāi)(公告)日 2016-07-06
申請(qǐng)公布號(hào) CN105740225A 申請(qǐng)公布日 2016-07-06
分類號(hào) G06F17/27 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 鹿文鵬;孟凡擎;杜月寒 申請(qǐng)(專利權(quán))人 山東經(jīng)偉晟睿數(shù)據(jù)技術(shù)有限公司
代理機(jī)構(gòu) - 代理人 -
地址 250001 山東省濟(jì)南市高新區(qū)新濼大街2008號(hào)銀荷大廈C座1002室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種融合句子局部上下文與文檔領(lǐng)域信息的詞義消歧方法,屬于自然語(yǔ)言處理技術(shù)領(lǐng)域。其步驟為:①對(duì)歧義詞所在的句子進(jìn)行依存句法分析,獲得與歧義詞具有直接依存關(guān)系的句子局部上下文相關(guān)詞;②對(duì)領(lǐng)域文檔集合進(jìn)行依存句法分析,收集其所包含的全部的依存元組,構(gòu)建依存元組庫(kù);③對(duì)依存元組庫(kù)進(jìn)行統(tǒng)計(jì)分析,找到與歧義詞關(guān)系最為密切的一組領(lǐng)域相關(guān)詞;④根據(jù)領(lǐng)域相關(guān)詞的依存分布相似度及其與局部上下文的詞義相關(guān)度,確定其消歧權(quán)重;⑤將句子局部上下文相關(guān)詞和領(lǐng)域相關(guān)詞合并,構(gòu)建相關(guān)詞集合;⑥根據(jù)歧義詞的各個(gè)詞義與相關(guān)詞集合的加權(quán)累加相關(guān)度,判定正確詞義。本發(fā)明公開(kāi)的方法能夠提高詞義消歧系統(tǒng)在特定領(lǐng)域上的適應(yīng)性,提高消歧正確率。