一種短文本相似度計算系統(tǒng)及其訓(xùn)練方法
基本信息
申請?zhí)?/td> | CN201911375500.2 | 申請日 | - |
公開(公告)號 | CN111209395A | 公開(公告)日 | 2020-05-29 |
申請公布號 | CN111209395A | 申請公布日 | 2020-05-29 |
分類號 | G06F16/35;G06F40/117;G06F40/126;G06F40/205;G06F40/30;G06N3/08 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王丙棟;游世學(xué) | 申請(專利權(quán))人 | 銅陵中科匯聯(lián)科技有限公司 |
代理機構(gòu) | 北京慶峰財智知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 銅陵中科匯聯(lián)科技有限公司 |
地址 | 244000 安徽省銅陵市北斗星城1-A1樓9樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公布了一種短文本相似度計算系統(tǒng)及其訓(xùn)練方法,所述系統(tǒng)包含以下模塊:文本切分模塊、文本編碼器、文本相似度計算神經(jīng)網(wǎng)絡(luò)模塊。本申請的短文本相似度計算系統(tǒng),對需要計算相似度的兩個短文本編碼使用相同的編碼器,再使用注意力機制得到第一個文本對第二個文本的注意力,歸一化注意力得到相似度的值。本申請的神經(jīng)網(wǎng)絡(luò)有效利用了文本中詞語在上下文的語義編碼以及文本整體的語義編碼,使用注意力來表征相似度,緩解了文本級語義編碼的信息損失,避免了詞語級語義編碼孤立于上下文的問題。 |
