一種基于圖神經(jīng)網(wǎng)絡(luò)的多元特征融合中文文本分類方法
基本信息
申請(qǐng)?zhí)?/td> | CN202010868076.1 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112015863A | 公開(公告)日 | 2020-12-01 |
申請(qǐng)公布號(hào) | CN112015863A | 申請(qǐng)公布日 | 2020-12-01 |
分類號(hào) | G06F16/33(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 范夢(mèng)真;嚴(yán)一博;程大偉;羅軼鳳;錢衛(wèi)寧;周傲英 | 申請(qǐng)(專利權(quán))人 | 上海瞰點(diǎn)科技有限責(zé)任公司 |
代理機(jī)構(gòu) | 上海藍(lán)迪專利商標(biāo)事務(wù)所(普通合伙) | 代理人 | 華東師范大學(xué);上海瞰點(diǎn)科技有限責(zé)任公司 |
地址 | 200241上海市閔行區(qū)東川路500號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于圖神經(jīng)網(wǎng)絡(luò)的多元特征融合中文文本分類方法,屬于自然語(yǔ)言處理領(lǐng)域。其特點(diǎn)是融合全局圖卷積特征和局部序列特征進(jìn)行文本分類,通過構(gòu)建文本與命名實(shí)體的異構(gòu)圖并利用異構(gòu)圖進(jìn)行全局圖卷積特征提取,基于GRU的序列編碼器進(jìn)行局部序列特征提取,最后融合兩部分特征輸入分類器,特別地,在異構(gòu)圖特征提取階段和特征融合階段使用attention機(jī)制來提高重要信息的權(quán)重。本發(fā)明在某領(lǐng)域的文本分類任務(wù)上,相比于現(xiàn)有的分類模型,本發(fā)明提出的模型的中文文本分類準(zhǔn)確率明顯提高,能更好地應(yīng)用于對(duì)分類精度要求高的某領(lǐng)域文本分類任務(wù)上。?? |
