文本分類方法、裝置、終端設(shè)備和可讀存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202011308990.7 | 申請日 | - |
公開(公告)號 | CN112417153A | 公開(公告)日 | 2021-02-26 |
申請公布號 | CN112417153A | 申請公布日 | 2021-02-26 |
分類號 | G06F16/35(2019.01)I;G06K9/62(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王欣芝;廖康寧;楊斌 | 申請(專利權(quán))人 | 虎博網(wǎng)絡(luò)技術(shù)(上海)有限公司 |
代理機構(gòu) | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) | 代理人 | 梁韜 |
地址 | 200050上海市長寧區(qū)宣化路3號二層2561室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實施例公開了文本分類方法、裝置、終端設(shè)備和可讀存儲介質(zhì),該方法包括:獲取各個基礎(chǔ)詞對應的基礎(chǔ)詞向量和各個主題詞對應的主題詞向量;對各個主題詞向量進行降維處理,以獲得各個主題詞向量對應的低維主題詞向量;確定各個主題詞的類別總數(shù)和同類主題詞的數(shù)目;計算第i個類別中的k個低維主題詞向量的平均主題詞向量,將各個基礎(chǔ)詞向量分別和平均主題詞向量拼接;將各個拼接向量依次輸入至預先訓練達標的文本分類模型,以確定文本內(nèi)容對應第i個類別的概率值。本發(fā)明的技術(shù)方案使得各個詞向量與類別相關(guān)的特征增強,與類別不相關(guān)的特征減弱,使得文本分類模型能更快速、更準確的確定文本內(nèi)容的對應類別。?? |
