基于網(wǎng)頁文本分類的數(shù)據(jù)處理方法、智能終端及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN201910682113.7 申請(qǐng)日 -
公開(公告)號(hào) CN110413786B 公開(公告)日 2021-12-28
申請(qǐng)公布號(hào) CN110413786B 申請(qǐng)公布日 2021-12-28
分類號(hào) G06F16/35(2019.01)I;G06F16/338(2019.01)I;G06F16/951(2019.01)I;G06N3/04(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張玳輝 申請(qǐng)(專利權(quán))人 北京智游網(wǎng)安科技有限公司
代理機(jī)構(gòu) 深圳市君勝知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 王永文;陳專
地址 100000北京市海淀區(qū)東北旺西路8號(hào)中關(guān)村軟件園10號(hào)樓2層207-2(國永融通大廈)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了基于網(wǎng)頁文本分類的數(shù)據(jù)處理方法、智能終端及存儲(chǔ)介質(zhì),所述方法包括:從數(shù)據(jù)庫中選取滿足所有分類應(yīng)用描述的分類樣本的文本數(shù)據(jù)進(jìn)行清洗和標(biāo)注;將經(jīng)過清洗和標(biāo)注后的文本數(shù)據(jù)輸入到循環(huán)神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,所述循環(huán)神經(jīng)網(wǎng)絡(luò)模型根據(jù)損失曲線調(diào)整擬合參數(shù);將經(jīng)過清洗和序列化后的文本數(shù)據(jù)輸入到所述循環(huán)神經(jīng)網(wǎng)絡(luò)模型,所述循環(huán)神經(jīng)網(wǎng)絡(luò)模型輸出預(yù)測值;根據(jù)輸出的所述預(yù)測值,所述循環(huán)神經(jīng)網(wǎng)絡(luò)模型將數(shù)據(jù)庫中入庫的信息進(jìn)行分類,通過后臺(tái)篩選出相關(guān)分類的應(yīng)用并進(jìn)行展示。本發(fā)明通過深度學(xué)習(xí)算法將文本信息進(jìn)行特征提取訓(xùn)練,輸出預(yù)測值,自動(dòng)將數(shù)據(jù)庫中入庫的信息進(jìn)行分類,用戶只需要通過后臺(tái)即可篩選出相關(guān)分類的應(yīng)用。