文本分類方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202111346141.5 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113779259A | 公開(公告)日 | 2021-12-10 |
申請(qǐng)公布號(hào) | CN113779259A | 申請(qǐng)公布日 | 2021-12-10 |
分類號(hào) | G06F16/35(2019.01)I;G06F16/31(2019.01)I;G06F40/289(2020.01)I;G06F40/216(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 楊華宇;王昕;胡芳;王歡 | 申請(qǐng)(專利權(quán))人 | 太平金融科技服務(wù)(上海)有限公司 |
代理機(jī)構(gòu) | 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 | 代理人 | 姜曉云 |
地址 | 200135上海市浦東新區(qū)卡園三路58號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)涉及大數(shù)據(jù)技術(shù)領(lǐng)域,特別是涉及一種文本分類方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。所述方法包括:獲取待分類文本數(shù)據(jù);對(duì)待分類文本數(shù)據(jù)進(jìn)行分句處理,得到多個(gè)文本句;從各文本句中提取出文本句分詞以及對(duì)應(yīng)各文本句分詞的關(guān)聯(lián)詞,以得到各文本句對(duì)應(yīng)的多個(gè)關(guān)聯(lián)詞組;根據(jù)各關(guān)聯(lián)詞組,生成對(duì)應(yīng)的多個(gè)文本主題,并將待分類文本數(shù)據(jù)的各文本句添加至對(duì)應(yīng)的文本主題中。采用本方法能夠提升文本分類的準(zhǔn)確性。 |
