一種文本分類方法、裝置、電子設備及存儲介質
基本信息
申請?zhí)?/td> | CN202010641209.1 | 申請日 | - |
公開(公告)號 | CN113901203A | 公開(公告)日 | 2022-01-07 |
申請公布號 | CN113901203A | 申請公布日 | 2022-01-07 |
分類號 | G06F16/35(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王永杰 | 申請(專利權)人 | 上海流利說信息技術有限公司 |
代理機構 | 北京信遠達知識產權代理有限公司 | 代理人 | 李兆軒 |
地址 | 200090上海市楊浦區(qū)長陽路1687號西1168幢(C樓)一層C2101室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了一種文本分類方法,所述文本分類方法包括確定訓練集中訓練樣本的特征對比信息和相似度標簽;根據(jù)所述相似度標簽構建每一訓練樣本對應的樣本列表;調整排序模型的參數(shù)并利用所述排序模型根據(jù)每一所述訓練樣本的特征對比信息計算每一樣本分組內基準樣本和分組內其他訓練樣本的文本特征相似度得分,以使所述訓練樣本的文本特征相似度得分排序序列與所述樣本列表的NDCG指標大于預設值;利用所述排序模型確定每一索引文本與待分類文本的相似度,并根據(jù)相似度排名前K位的索引文本的文本等級確定所述待分類文本的文本類別。本申請能夠提高文本分類的準確率。本申請還公開了一種文本分類裝置、一種存儲介質及一種電子設備,具有以上有益效果。 |
