一種基于自回歸與自編碼的語義相似度獲取方法
基本信息
申請?zhí)?/td> | CN201911362305.6 | 申請日 | - |
公開(公告)號(hào) | CN111144129A | 公開(公告)日 | 2020-05-12 |
申請公布號(hào) | CN111144129A | 申請公布日 | 2020-05-12 |
分類號(hào) | G06F40/30;G06F40/284;G06N3/04 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 王開業(yè);蔣登位;崔斌;譚啟濤 | 申請(專利權(quán))人 | 成都航天科工大數(shù)據(jù)研究院有限公司 |
代理機(jī)構(gòu) | 成都頂峰專利事務(wù)所(普通合伙) | 代理人 | 成都航天科工大數(shù)據(jù)研究院有限公司 |
地址 | 610000 四川省成都市天府新區(qū)天府新經(jīng)濟(jì)產(chǎn)業(yè)園D區(qū)A6號(hào)樓4層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明屬于深度學(xué)習(xí)技術(shù)領(lǐng)域,公開了一種基于自回歸與自編碼的語義相似度獲取方法,包括如下步驟:S1:根據(jù)輸入的原始文本,進(jìn)行文本表征,獲取優(yōu)化的內(nèi)容特征和查詢特征;S2:根據(jù)上述步驟得到的內(nèi)容特征和查詢特征,使用優(yōu)化語義提取模型進(jìn)行語義特征提??;S3:根據(jù)上述步驟提取的原始文本的語義特征和現(xiàn)有的目標(biāo)文本的語義特征,獲取語義相似度。本發(fā)明提高了中文語言文本表征的準(zhǔn)確性和文本相似度計(jì)算的準(zhǔn)確率,解決了現(xiàn)有技術(shù)存在的性能損失、無法分辨單詞關(guān)系以及單向問題。 |
