一種文本分類方法和裝置
基本信息
申請?zhí)?/td> | CN202110046183.0 | 申請日 | - |
公開(公告)號 | CN112380350B | 公開(公告)日 | 2021-05-07 |
申請公布號 | CN112380350B | 申請公布日 | 2021-05-07 |
分類號 | G06F16/35(2019.01)I;G06F40/284(2020.01)I | 分類 | - |
發(fā)明人 | 于游;姜巍;張珊珊;趙永強(qiáng) | 申請(專利權(quán))人 | 北京育學(xué)園健康管理中心有限公司 |
代理機(jī)構(gòu) | 北京繪聚高科知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 羅碩 |
地址 | 100000北京市朝陽區(qū)西大望路1號2號樓2層會所3內(nèi)202室1單元 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實(shí)施例提供一種文本分類方法和裝置,本發(fā)明通過確定待分類的文本中的多個(gè)基本關(guān)鍵詞,并確定用于表示基本關(guān)鍵詞的在所述文本中的重要程度;當(dāng)在所述多個(gè)基本關(guān)鍵詞中確定位于預(yù)設(shè)的標(biāo)簽分類關(guān)鍵詞表中的標(biāo)簽關(guān)鍵詞,對所述標(biāo)簽關(guān)鍵詞的基本權(quán)重加權(quán),以增加該標(biāo)簽關(guān)鍵詞的權(quán)重,與此同時(shí),還基于預(yù)設(shè)的詞向量模型確定與所述標(biāo)簽關(guān)鍵詞關(guān)聯(lián)的相關(guān)關(guān)鍵詞,防止遺漏低頻關(guān)鍵詞;最終根據(jù)所述標(biāo)簽分類關(guān)鍵詞表中關(guān)鍵詞與分類結(jié)果的對應(yīng)關(guān)系,所述基本關(guān)鍵詞、標(biāo)簽關(guān)鍵詞、相關(guān)關(guān)鍵詞以及各自對應(yīng)的權(quán)重值,綜合確定出文本的分類結(jié)果,以提高分類結(jié)果的準(zhǔn)確度。?? |
