一種文本分類方法和裝置

基本信息

申請?zhí)?/td> CN202110046183.0 申請日 -
公開(公告)號 CN112380350A 公開(公告)日 2021-02-19
申請公布號 CN112380350A 申請公布日 2021-02-19
分類號 G06F16/35(2019.01)I;G06F40/284(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 于游;姜巍;張珊珊;趙永強 申請(專利權(quán))人 北京育學(xué)園健康管理中心有限公司
代理機構(gòu) 北京繪聚高科知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 羅碩
地址 100000北京市朝陽區(qū)太陽宮中路16號院1號樓4層408
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例提供一種文本分類方法和裝置,本發(fā)明通過確定待分類的文本中的多個基本關(guān)鍵詞,并確定用于表示基本關(guān)鍵詞的在所述文本中的重要程度;當(dāng)在所述多個基本關(guān)鍵詞中確定位于預(yù)設(shè)的標(biāo)簽分類關(guān)鍵詞表中的標(biāo)簽關(guān)鍵詞,對所述標(biāo)簽關(guān)鍵詞的基本權(quán)重加權(quán),以增加該標(biāo)簽關(guān)鍵詞的權(quán)重,與此同時,還基于預(yù)設(shè)的詞向量模型確定與所述標(biāo)簽關(guān)鍵詞關(guān)聯(lián)的相關(guān)關(guān)鍵詞,防止遺漏低頻關(guān)鍵詞;最終根據(jù)所述標(biāo)簽分類關(guān)鍵詞表中關(guān)鍵詞與分類結(jié)果的對應(yīng)關(guān)系,所述基本關(guān)鍵詞、標(biāo)簽關(guān)鍵詞、相關(guān)關(guān)鍵詞以及各自對應(yīng)的權(quán)重值,綜合確定出文本的分類結(jié)果,以提高分類結(jié)果的準(zhǔn)確度。??