文本分類方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202111346141.5 申請(qǐng)日 -
公開(公告)號(hào) CN113779259A 公開(公告)日 2021-12-10
申請(qǐng)公布號(hào) CN113779259A 申請(qǐng)公布日 2021-12-10
分類號(hào) G06F16/35(2019.01)I;G06F16/31(2019.01)I;G06F40/289(2020.01)I;G06F40/216(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 楊華宇;王昕;胡芳;王歡 申請(qǐng)(專利權(quán))人 太平金融科技服務(wù)(上海)有限公司
代理機(jī)構(gòu) 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 代理人 姜曉云
地址 200135上海市浦東新區(qū)卡園三路58號(hào)
法律狀態(tài) -

摘要

摘要 本申請(qǐng)涉及大數(shù)據(jù)技術(shù)領(lǐng)域,特別是涉及一種文本分類方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。所述方法包括:獲取待分類文本數(shù)據(jù);對(duì)待分類文本數(shù)據(jù)進(jìn)行分句處理,得到多個(gè)文本句;從各文本句中提取出文本句分詞以及對(duì)應(yīng)各文本句分詞的關(guān)聯(lián)詞,以得到各文本句對(duì)應(yīng)的多個(gè)關(guān)聯(lián)詞組;根據(jù)各關(guān)聯(lián)詞組,生成對(duì)應(yīng)的多個(gè)文本主題,并將待分類文本數(shù)據(jù)的各文本句添加至對(duì)應(yīng)的文本主題中。采用本方法能夠提升文本分類的準(zhǔn)確性。