一種基于終生學(xué)習(xí)的文本分類方法

基本信息

申請(qǐng)?zhí)?/td> CN202010542045.7 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN111723203A 公開(kāi)(公告)日 2020-09-29
申請(qǐng)公布號(hào) CN111723203A 申請(qǐng)公布日 2020-09-29
分類號(hào) G06F16/35(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉雨松 申請(qǐng)(專利權(quán))人 蘇州意能通信息技術(shù)有限公司
代理機(jī)構(gòu) 江蘇昆成律師事務(wù)所 代理人 蘇州意能通信息技術(shù)有限公司
地址 215000江蘇省蘇州市工業(yè)園區(qū)若水路388號(hào)E0202室
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┮环N基于終生學(xué)習(xí)的文本分類方法,先將文本信息通過(guò)預(yù)訓(xùn)練語(yǔ)言模型進(jìn)行向量化處理,得到所述文本信息中的各個(gè)中文單詞的詞向量;再將所述中文單詞的詞向量輸入深度神經(jīng)網(wǎng)絡(luò)模型,得到文本分類結(jié)果;如果不是訓(xùn)練模式則直接預(yù)測(cè)結(jié)果,如果為訓(xùn)練模式則進(jìn)行網(wǎng)絡(luò)參數(shù)更新;如果是首個(gè)任務(wù),則進(jìn)行常規(guī)的采用梯度下降法進(jìn)行神經(jīng)網(wǎng)絡(luò)的參數(shù)更新,如果不是首個(gè)任務(wù),是進(jìn)行數(shù)據(jù)更新/版本迭代,本發(fā)明采用權(quán)值修改的方法進(jìn)行神經(jīng)網(wǎng)絡(luò)參數(shù)更新,經(jīng)驗(yàn)證,更新一條數(shù)據(jù)僅需要幾秒鐘、更新1?2萬(wàn)條數(shù)據(jù)也只需要不到一小時(shí)的時(shí)間,大大的減少了深度神經(jīng)網(wǎng)絡(luò)模型版本迭代所需要的時(shí)間。??