一種用于神經(jīng)網(wǎng)絡(luò)輸入的大信息量文本表示方法

基本信息

申請(qǐng)?zhí)?/td> CN201811283253.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN109299272B 公開(kāi)(公告)日 2021-07-30
申請(qǐng)公布號(hào) CN109299272B 申請(qǐng)公布日 2021-07-30
分類(lèi)號(hào) G06F16/35(2019.01)I;G06N3/02(2006.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 蘭云飛;陳鐘;李青山;吳振豪;楊可靜;高健博;王曉青 申請(qǐng)(專(zhuān)利權(quán))人 北京國(guó)信云服科技有限公司
代理機(jī)構(gòu) 沈陽(yáng)東大知識(shí)產(chǎn)權(quán)代理有限公司 代理人 劉曉嵐
地址 100094北京市海淀區(qū)翠湖南環(huán)路13號(hào)院1號(hào)樓326室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種用于神經(jīng)網(wǎng)絡(luò)輸入的大信息量文本表示方法,涉及信息技術(shù)領(lǐng)域。該方法首先確定文本所在分類(lèi)體系下的分類(lèi)標(biāo)準(zhǔn),并獲得該標(biāo)準(zhǔn)下的關(guān)鍵詞;然后通過(guò)語(yǔ)義向量模型將每個(gè)關(guān)鍵詞轉(zhuǎn)化為語(yǔ)義向量,根據(jù)該分類(lèi)體系的關(guān)鍵詞字典,獲取每個(gè)關(guān)鍵詞的類(lèi)別向量,并將二者合并,得到一個(gè)詞向量;根據(jù)不同關(guān)鍵詞對(duì)同一實(shí)體的重要程度,選擇前k個(gè)重要的關(guān)鍵詞,并將其對(duì)應(yīng)的詞向量合并,得到每句話對(duì)應(yīng)的句子向量;將句子向量輸入到訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型中,輸出模型對(duì)該文本的分類(lèi)結(jié)果。本發(fā)明提供的大信息量文本表示方法,增加了神經(jīng)網(wǎng)絡(luò)輸入信息的信息表示能力的同時(shí),能夠減少神經(jīng)網(wǎng)絡(luò)的復(fù)雜性,增加神經(jīng)網(wǎng)絡(luò)的可表示性,還可以增加訓(xùn)練速度。