文書多標簽分類方法、裝置、電子設備及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202011220204.8 | 申請日 | - |
公開(公告)號 | CN112434157A | 公開(公告)日 | 2021-03-02 |
申請公布號 | CN112434157A | 申請公布日 | 2021-03-02 |
分類號 | G06F40/126(2020.01)I;G06F16/35(2019.01)I;G06F16/33(2019.01)I;G06Q50/18(2012.01)I;G06F40/284(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 邵博 | 申請(專利權(quán))人 | 平安直通咨詢有限公司上海分公司 |
代理機構(gòu) | 深圳市沃德知識產(chǎn)權(quán)代理事務所(普通合伙) | 代理人 | 高杰;于志光 |
地址 | 200000上海市靜安區(qū)常熟路8號裙房4層A室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及數(shù)據(jù)處理技術(shù),揭露一種文書多標簽分類方法,包括:對原始文書集進行預處理,得到標準文書集并對其進行多標簽處理,得到文書標簽集,將標準文書集按照批次數(shù)進行劃分,得到多個文書子集并輸入至構(gòu)建的原始文書多分類模型進行訓練,計算所述訓練得到的訓練值集與文書標簽集的誤差值,在誤差值大于預設的誤差閾值,調(diào)整所述文書多分類模型的內(nèi)部參數(shù),直到誤差值小于或等于誤差閾值時,得到標準文書多分類模型,將待分類文書輸入至標準文書多分類模型,得到多種分類結(jié)果。本發(fā)明還涉及區(qū)塊鏈技術(shù),所述原始文書集可以存儲在區(qū)塊鏈中。本發(fā)明還揭露一種文書分類裝置、電子設備及存儲介質(zhì)。本發(fā)明可以提高文書分類的多樣性。?? |
