一種超大規(guī)模數(shù)據(jù)自動(dòng)分類處理方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202210331348.3 申請日 -
公開(公告)號(hào) CN114662472A 公開(公告)日 2022-06-24
申請公布號(hào) CN114662472A 申請公布日 2022-06-24
分類號(hào) G06F40/216(2020.01)I;G06F40/211(2020.01)I;G06F16/35(2019.01)I;G06F16/33(2019.01)I;G06K9/62(2022.01)I;G06Q50/18(2012.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李慶利;陰玉敏;曹廣學(xué);雷懷興;趙世茂 申請(專利權(quán))人 求實(shí)科技集團(tuán)有限公司
代理機(jī)構(gòu) 河北知亦可為專利代理事務(wù)所(特殊普通合伙) 代理人 -
地址 050000河北省石家莊市橋西區(qū)勝利南街118號(hào)塔壇國際商貿(mào)城5號(hào)寫字樓2406室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及專利分類技術(shù)領(lǐng)域,提出了一種超大規(guī)模數(shù)據(jù)自動(dòng)分類處理方法及系統(tǒng),包括對Bert模型進(jìn)行訓(xùn)練,得到文本分類模型,再將分類結(jié)果進(jìn)行二次校驗(yàn),通過對專利文本的結(jié)構(gòu)進(jìn)行隨機(jī)抽取后,重新編排成若干新的文本,再對這些子文本的分類情況進(jìn)行評(píng)分式的篩選,對照原始分類結(jié)果給出最終的分類。進(jìn)一步提高了分類結(jié)果的準(zhǔn)確率。本發(fā)明能夠以較高的準(zhǔn)確性對新審核的專利文本進(jìn)行自動(dòng)分類,且分類的準(zhǔn)確率、效率都應(yīng)高于人工分類。