基于文本相似度算法的相似問題生成方法、系統(tǒng)、電子裝置和存儲介質

基本信息

申請?zhí)?/td> CN202110367263.6 申請日 -
公開(公告)號 CN113139040A 公開(公告)日 2021-07-20
申請公布號 CN113139040A 申請公布日 2021-07-20
分類號 G06F16/332(2019.01)I;G06K9/62(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 嵇望;王偉凱;錢艷;朱鵬飛;安毫億;梁青 申請(專利權)人 杭州遠傳新業(yè)科技股份有限公司
代理機構 杭州創(chuàng)智卓英知識產(chǎn)權代理事務所(普通合伙) 代理人 張超
地址 310051浙江省杭州市濱江區(qū)信誠路857號世貿中心23樓
法律狀態(tài) -

摘要

摘要 本申請涉及一種基于文本相似度算法的相似問題生成方法、系統(tǒng)、電子裝置和存儲介質,其中,該基于文本相似度算法的相似問題生成方法包括:獲取交互場景文本數(shù)據(jù),生成問答對文本;計算問答對文本中的答案文本與行業(yè)問答對中的答案文本的文本相似度,確定相似度最大的行業(yè)問答對;計算問答對文本中的問題文本與相似度最大的行業(yè)問答對中的問題文本的文本相似度,確定問題文本相似度最大值;將問題文本的相似度最大值與預設閾值進行比對,若滿足預設閾值,則將問題文本相似度最大值對應的問答對文本中的問題文本補充到對應的行業(yè)問答對語料中作為問題文本的相似問題。通過本申請,解決了相關技術中生成的相似問題語句不通順和包含冗余內容的問題。