一種用于神經(jīng)網(wǎng)絡(luò)輸入的大信息量文本表示方法
基本信息
申請(qǐng)?zhí)?/td> | CN201811283253.9 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN109299272B | 公開(kāi)(公告)日 | 2021-07-30 |
申請(qǐng)公布號(hào) | CN109299272B | 申請(qǐng)公布日 | 2021-07-30 |
分類(lèi)號(hào) | G06F16/35(2019.01)I;G06N3/02(2006.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 蘭云飛;陳鐘;李青山;吳振豪;楊可靜;高健博;王曉青 | 申請(qǐng)(專(zhuān)利權(quán))人 | 北京國(guó)信云服科技有限公司 |
代理機(jī)構(gòu) | 沈陽(yáng)東大知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 劉曉嵐 |
地址 | 100094北京市海淀區(qū)翠湖南環(huán)路13號(hào)院1號(hào)樓326室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種用于神經(jīng)網(wǎng)絡(luò)輸入的大信息量文本表示方法,涉及信息技術(shù)領(lǐng)域。該方法首先確定文本所在分類(lèi)體系下的分類(lèi)標(biāo)準(zhǔn),并獲得該標(biāo)準(zhǔn)下的關(guān)鍵詞;然后通過(guò)語(yǔ)義向量模型將每個(gè)關(guān)鍵詞轉(zhuǎn)化為語(yǔ)義向量,根據(jù)該分類(lèi)體系的關(guān)鍵詞字典,獲取每個(gè)關(guān)鍵詞的類(lèi)別向量,并將二者合并,得到一個(gè)詞向量;根據(jù)不同關(guān)鍵詞對(duì)同一實(shí)體的重要程度,選擇前k個(gè)重要的關(guān)鍵詞,并將其對(duì)應(yīng)的詞向量合并,得到每句話對(duì)應(yīng)的句子向量;將句子向量輸入到訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型中,輸出模型對(duì)該文本的分類(lèi)結(jié)果。本發(fā)明提供的大信息量文本表示方法,增加了神經(jīng)網(wǎng)絡(luò)輸入信息的信息表示能力的同時(shí),能夠減少神經(jīng)網(wǎng)絡(luò)的復(fù)雜性,增加神經(jīng)網(wǎng)絡(luò)的可表示性,還可以增加訓(xùn)練速度。 |
