一種融合句子局部上下文與文檔領(lǐng)域信息的詞義消歧方法
基本信息
申請(qǐng)?zhí)?/td> | CN201610033097.5 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN105740225A | 公開(kāi)(公告)日 | 2016-07-06 |
申請(qǐng)公布號(hào) | CN105740225A | 申請(qǐng)公布日 | 2016-07-06 |
分類號(hào) | G06F17/27 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 鹿文鵬;孟凡擎;杜月寒 | 申請(qǐng)(專利權(quán))人 | 山東經(jīng)偉晟睿數(shù)據(jù)技術(shù)有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 250001 山東省濟(jì)南市高新區(qū)新濼大街2008號(hào)銀荷大廈C座1002室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種融合句子局部上下文與文檔領(lǐng)域信息的詞義消歧方法,屬于自然語(yǔ)言處理技術(shù)領(lǐng)域。其步驟為:①對(duì)歧義詞所在的句子進(jìn)行依存句法分析,獲得與歧義詞具有直接依存關(guān)系的句子局部上下文相關(guān)詞;②對(duì)領(lǐng)域文檔集合進(jìn)行依存句法分析,收集其所包含的全部的依存元組,構(gòu)建依存元組庫(kù);③對(duì)依存元組庫(kù)進(jìn)行統(tǒng)計(jì)分析,找到與歧義詞關(guān)系最為密切的一組領(lǐng)域相關(guān)詞;④根據(jù)領(lǐng)域相關(guān)詞的依存分布相似度及其與局部上下文的詞義相關(guān)度,確定其消歧權(quán)重;⑤將句子局部上下文相關(guān)詞和領(lǐng)域相關(guān)詞合并,構(gòu)建相關(guān)詞集合;⑥根據(jù)歧義詞的各個(gè)詞義與相關(guān)詞集合的加權(quán)累加相關(guān)度,判定正確詞義。本發(fā)明公開(kāi)的方法能夠提高詞義消歧系統(tǒng)在特定領(lǐng)域上的適應(yīng)性,提高消歧正確率。 |
