一種基于詞向量的英漢詞義映射方法和裝置
基本信息
申請?zhí)?/td> | CN201610765658.0 | 申請日 | - |
公開(公告)號 | CN106339371B | 公開(公告)日 | 2019-04-30 |
申請公布號 | CN106339371B | 申請公布日 | 2019-04-30 |
分類號 | G06F17/28;G06F17/27 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 鹿文鵬;孟凡擎;張玉騰 | 申請(專利權(quán))人 | 山東經(jīng)偉晟睿數(shù)據(jù)技術(shù)有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 250001 山東省濟(jì)南市高新區(qū)新濼大街2008號銀荷大廈C座1002室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種詞向量的英漢詞義映射方法和裝置。方法包括:由英文知識庫提取待映射詞義的同義詞集,而后根據(jù)英漢詞典查詢同義詞集中各個同義詞的候選中文詞義;由英文知識庫提取待映射詞義的英文注釋和例句,并根據(jù)英漢詞典查詢各個候選中文詞義的英文注釋和例句;在英文語料庫上訓(xùn)練詞向量,為各個英文注釋和例句分別生成句子向量;計(jì)算待映射詞義的英文注釋和例句的句子向量與候選中文詞義的英文注釋和例句的句子向量的相似度,并計(jì)算待映射詞義與候選中文詞義的綜合相似度;選擇綜合相似度最大的候選中文詞義作為待映射詞義的目標(biāo)詞義。本發(fā)明可以有效發(fā)揮詞向量的優(yōu)勢,更為準(zhǔn)確地進(jìn)行詞義映射。 |
