一種結(jié)合多頭自注意力機(jī)制的CNN文本分類方法

基本信息

申請(qǐng)?zhí)?/td> CN202010040278.7 申請(qǐng)日 -
公開(公告)號(hào) CN111259666A 公開(公告)日 2020-06-09
申請(qǐng)公布號(hào) CN111259666A 申請(qǐng)公布日 2020-06-09
分類號(hào) G06F40/289(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉星辰;陳曉峰;麻沁甜 申請(qǐng)(專利權(quán))人 上海勃池信息技術(shù)有限公司
代理機(jī)構(gòu) 上海領(lǐng)洋專利代理事務(wù)所(普通合伙) 代理人 上海勃池信息技術(shù)有限公司
地址 200000上海市嘉定區(qū)匯源路55號(hào)8幢5層517室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種結(jié)合多頭自注意力機(jī)制的CNN文本分類方法,包括:獲取待分類文本的分詞序列,并進(jìn)行特殊符號(hào)和停止詞過(guò)濾等預(yù)處理;查詢預(yù)設(shè)或隨機(jī)初始化的詞嵌入模型獲取分詞序列的嵌入矩陣,矩陣的每一行為各分詞的嵌入向量;針對(duì)所得嵌入矩陣的各行向量,疊加該向量對(duì)應(yīng)分詞的位置編碼向量;對(duì)疊加位置編碼后的嵌入矩陣通過(guò)自注意力機(jī)制生成自注意力矩陣;重復(fù)若干次自注意力矩陣的生成,將生成的多個(gè)矩陣在列的維度上進(jìn)行拼接;將詞序列拼接后的自注意力矩陣與加權(quán)矩陣相乘,實(shí)現(xiàn)降維和融合;將降維和融合后的自注意力矩陣輸入CNN,進(jìn)行訓(xùn)練或者預(yù)測(cè)。??