一種基于Transformer的中文新聞分類方法
基本信息
申請(qǐng)?zhí)?/td> | CN202010375567.2 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN111666373A | 公開(公告)日 | 2020-09-15 |
申請(qǐng)公布號(hào) | CN111666373A | 申請(qǐng)公布日 | 2020-09-15 |
分類號(hào) | G06F16/33(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 范夢(mèng)真;楊芳洲;劉金;羅軼鳳;錢衛(wèi)寧;周傲英 | 申請(qǐng)(專利權(quán))人 | 上海瞰點(diǎn)科技有限責(zé)任公司 |
代理機(jī)構(gòu) | 上海藍(lán)迪專利商標(biāo)事務(wù)所(普通合伙) | 代理人 | 華東師范大學(xué);上海瞰點(diǎn)科技有限責(zé)任公司 |
地址 | 200241上海市閔行區(qū)東川路500號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于Transformer的中文新聞分類方法,其特點(diǎn)是采用可并行的Transformer?Encoder來(lái)對(duì)文本序列進(jìn)行編碼,采用“詞?句?文章”多層的網(wǎng)絡(luò)來(lái)提取新聞的文本信息,利用attention機(jī)制來(lái)降維得到文章級(jí)別的向量,并且結(jié)合NER命名實(shí)體識(shí)別技術(shù)引入實(shí)體信息來(lái)豐富特征,最后融合兩部分特征輸入分類器,訓(xùn)練得到分類模型,提高分類模型訓(xùn)練的效率和預(yù)測(cè)的精度。本發(fā)明在某領(lǐng)域的文本分類任務(wù)上,相比于現(xiàn)有的分類模型,可并行化的序列編碼方式降低了模型訓(xùn)練的時(shí)間開銷,attention機(jī)制和加入實(shí)體信息提高了模型對(duì)重要信息的識(shí)別能力,同時(shí),識(shí)別了新聞中的實(shí)體信息,減少了機(jī)器閱讀文字的歧義。?? |
