一種基于自定義權重算法的網(wǎng)站分類方法

基本信息

申請?zhí)?/td> CN202111453324.7 申請日 -
公開(公告)號 CN114048420A 公開(公告)日 2022-02-15
申請公布號 CN114048420A 申請公布日 2022-02-15
分類號 G06F16/958(2019.01)I;G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/237(2020.01)I;G06F40/284(2020.01)I;G06K9/62(2022.01)I 分類 計算;推算;計數(shù);
發(fā)明人 孫濤;陳濤;吳冠標;孫中民 申請(專利權)人 天津市國瑞數(shù)碼安全系統(tǒng)股份有限公司
代理機構 天津璽名知識產(chǎn)權代理有限公司 代理人 劉暢
地址 300000天津市濱海新區(qū)華苑產(chǎn)業(yè)區(qū)海泰綠色產(chǎn)業(yè)基地K1-1-601室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于自定義權重算法的網(wǎng)站分類方法,包括:采集網(wǎng)站文本數(shù)據(jù)進行初始處理得到網(wǎng)站文本初始處理數(shù)據(jù);利用所述網(wǎng)站文本初始處理數(shù)據(jù)進行文本分類,采用大數(shù)據(jù)技術獲取用戶提供的網(wǎng)站文本,定期更新特征字典,可以第一時間發(fā)現(xiàn)新特征、新重點,從而提升此方法的感知敏感度,保障分類活躍度,微觀上拋棄傳統(tǒng)大篇幅文本分類機制,提取主題作為分析內(nèi)容可以壓縮單次處理成本,提高效率;宏觀上采用大數(shù)據(jù)技術作為計算方式,可以應對海量文本快速分類的需求,可以快速的進行標注,從而提升標注效率,且提升分類精確度。