一種基于自定義權重算法的網(wǎng)站分類方法
基本信息
申請?zhí)?/td> | CN202111453324.7 | 申請日 | - |
公開(公告)號 | CN114048420A | 公開(公告)日 | 2022-02-15 |
申請公布號 | CN114048420A | 申請公布日 | 2022-02-15 |
分類號 | G06F16/958(2019.01)I;G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/237(2020.01)I;G06F40/284(2020.01)I;G06K9/62(2022.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 孫濤;陳濤;吳冠標;孫中民 | 申請(專利權)人 | 天津市國瑞數(shù)碼安全系統(tǒng)股份有限公司 |
代理機構 | 天津璽名知識產(chǎn)權代理有限公司 | 代理人 | 劉暢 |
地址 | 300000天津市濱海新區(qū)華苑產(chǎn)業(yè)區(qū)海泰綠色產(chǎn)業(yè)基地K1-1-601室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于自定義權重算法的網(wǎng)站分類方法,包括:采集網(wǎng)站文本數(shù)據(jù)進行初始處理得到網(wǎng)站文本初始處理數(shù)據(jù);利用所述網(wǎng)站文本初始處理數(shù)據(jù)進行文本分類,采用大數(shù)據(jù)技術獲取用戶提供的網(wǎng)站文本,定期更新特征字典,可以第一時間發(fā)現(xiàn)新特征、新重點,從而提升此方法的感知敏感度,保障分類活躍度,微觀上拋棄傳統(tǒng)大篇幅文本分類機制,提取主題作為分析內(nèi)容可以壓縮單次處理成本,提高效率;宏觀上采用大數(shù)據(jù)技術作為計算方式,可以應對海量文本快速分類的需求,可以快速的進行標注,從而提升標注效率,且提升分類精確度。 |
