文本分類的方法、裝置、電子設(shè)備及介質(zhì)

基本信息

申請?zhí)?/td> CN201911239837.0 申請日 -
公開(公告)號 CN112925903A 公開(公告)日 2021-06-08
申請公布號 CN112925903A 申請公布日 2021-06-08
分類號 G06F16/35 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 叢小蔓;董春巖;饒曉燕;韓周杰;程書娟;李春朋;陳燕輝;李一哲;于嘯晨;白潔;崔倩倩 申請(專利權(quán))人 北京佳格天地科技有限公司
代理機(jī)構(gòu) 北京恒博知識產(chǎn)權(quán)代理有限公司 代理人 范勝祥
地址 100125 北京市朝陽區(qū)農(nóng)展館南里11號
法律狀態(tài) -

摘要

摘要 本申請公開了一種文本分類的方法、裝置、電子設(shè)備及介質(zhì)。其中,本申請中,在獲取至少一個(gè)待分類文本之后,可以進(jìn)一步的獲取至少一個(gè)待分類文本中,各待分類文本的關(guān)鍵詞指數(shù)以及信息熵指數(shù),并確定各待分類文本對應(yīng)的類別標(biāo)簽,再基于各待分類文本對應(yīng)的類別標(biāo)簽,為各待分類文本進(jìn)行分類。通過應(yīng)用本申請的技術(shù)方案,可以根據(jù)各個(gè)文本數(shù)據(jù)中包含的特定類別的關(guān)鍵詞數(shù)量以及其反映特定類型的信息量大小的兩個(gè)維度來確定各個(gè)文本數(shù)據(jù)的類別。進(jìn)而可以避免相關(guān)技術(shù)中存在的對文本分類結(jié)果不夠準(zhǔn)確的問題。