一種超大規(guī)模數(shù)據(jù)自動(dòng)分類處理方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN202210331348.3 | 申請日 | - |
公開(公告)號(hào) | CN114662472A | 公開(公告)日 | 2022-06-24 |
申請公布號(hào) | CN114662472A | 申請公布日 | 2022-06-24 |
分類號(hào) | G06F40/216(2020.01)I;G06F40/211(2020.01)I;G06F16/35(2019.01)I;G06F16/33(2019.01)I;G06K9/62(2022.01)I;G06Q50/18(2012.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 李慶利;陰玉敏;曹廣學(xué);雷懷興;趙世茂 | 申請(專利權(quán))人 | 求實(shí)科技集團(tuán)有限公司 |
代理機(jī)構(gòu) | 河北知亦可為專利代理事務(wù)所(特殊普通合伙) | 代理人 | - |
地址 | 050000河北省石家莊市橋西區(qū)勝利南街118號(hào)塔壇國際商貿(mào)城5號(hào)寫字樓2406室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及專利分類技術(shù)領(lǐng)域,提出了一種超大規(guī)模數(shù)據(jù)自動(dòng)分類處理方法及系統(tǒng),包括對Bert模型進(jìn)行訓(xùn)練,得到文本分類模型,再將分類結(jié)果進(jìn)行二次校驗(yàn),通過對專利文本的結(jié)構(gòu)進(jìn)行隨機(jī)抽取后,重新編排成若干新的文本,再對這些子文本的分類情況進(jìn)行評(píng)分式的篩選,對照原始分類結(jié)果給出最終的分類。進(jìn)一步提高了分類結(jié)果的準(zhǔn)確率。本發(fā)明能夠以較高的準(zhǔn)確性對新審核的專利文本進(jìn)行自動(dòng)分類,且分類的準(zhǔn)確率、效率都應(yīng)高于人工分類。 |
