一種基于circle loss的文本相似度匹配方法、裝置、計(jì)算機(jī)設(shè)備和儲存介質(zhì)

基本信息

申請?zhí)?/td> CN202110417707.2 申請日 -
公開(公告)號 CN113221530A 公開(公告)日 2021-08-06
申請公布號 CN113221530A 申請公布日 2021-08-06
分類號 G06F40/194;G06F16/332;G06K9/62 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉偉;楊紅飛 申請(專利權(quán))人 杭州火石數(shù)智科技有限公司
代理機(jī)構(gòu) 寧波鄞州全方專利商標(biāo)事務(wù)所(普通合伙) 代理人 樓瑜舟
地址 310000 浙江省杭州市濱江區(qū)西興街道物聯(lián)網(wǎng)街369號A幢9層905室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于circle loss的文本相似度匹配方法、裝置、計(jì)算機(jī)設(shè)備和儲存介質(zhì),其涉及計(jì)算機(jī)信息處理技術(shù)領(lǐng)域,所述方法包括:S1樣本準(zhǔn)備;S2模型訓(xùn)練;S3模型預(yù)測;在S2模型訓(xùn)練階段,首先使用孿生網(wǎng)絡(luò)結(jié)構(gòu)分批訓(xùn)練上述樣本集;然后分別計(jì)算錨樣本與正樣本、負(fù)樣本之間的距離:利用electra模型計(jì)算樣本的3)使用circle loss損失函數(shù)計(jì)算損失值,接著利用electra模型計(jì)算每個(gè)樣本的特征表示,將circle loss損失函數(shù)與electra模型相結(jié)合,并使其應(yīng)用到問答系統(tǒng)中,可得到文本相似度匹配速度與精度均較高的問題收集方法。