一種分類分級(jí)清單智能打標(biāo)方法
基本信息
申請(qǐng)?zhí)?/td> | CN202111102610.9 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113705728A | 公開(公告)日 | 2021-11-26 |
申請(qǐng)公布號(hào) | CN113705728A | 申請(qǐng)公布日 | 2021-11-26 |
分類號(hào) | G06K9/62(2006.01)I;G06F40/284(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 盧紅波;張林成 | 申請(qǐng)(專利權(quán))人 | 全知科技(杭州)有限責(zé)任公司 |
代理機(jī)構(gòu) | 杭州奇炬知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | 賀心韜 |
地址 | 310000浙江省杭州市余杭區(qū)倉前街道倉興路1號(hào)2幢204B室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種分類分級(jí)清單智能打標(biāo)方法,涉及通信技術(shù)領(lǐng)域,解決了目前在大數(shù)據(jù)量級(jí)下,數(shù)據(jù)清單打標(biāo)耗時(shí)費(fèi)力,同時(shí)打標(biāo)質(zhì)量不高的技術(shù)問題。本技術(shù)方案通過不同數(shù)據(jù)庫讀取表和字段信息,統(tǒng)一文本行格式后進(jìn)行預(yù)處理和中英文分詞和英文翻譯操作,基于文本行的內(nèi)容多樣性和復(fù)雜性,先做文本粗分類,得到總體結(jié)果尚可的打過標(biāo)的文本行,再基于fastText模型訓(xùn)練和短文本分類。本發(fā)明短文本分類中兼具高速和高質(zhì)量的模型,對(duì)文本行進(jìn)行訓(xùn)練和測(cè)試得到文本行的合理的打標(biāo)結(jié)果,智能打標(biāo),省時(shí)省力。 |
