文檔向量化方法、裝置、計(jì)算設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202111343118.0 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN114201604A | 公開(kāi)(公告)日 | 2022-03-18 |
申請(qǐng)公布號(hào) | CN114201604A | 申請(qǐng)公布日 | 2022-03-18 |
分類(lèi)號(hào) | G06F16/35(2019.01)I;G06K9/62(2022.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 郭順;陳成才 | 申請(qǐng)(專(zhuān)利權(quán))人 | 上海智臻智能網(wǎng)絡(luò)科技股份有限公司 |
代理機(jī)構(gòu) | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 連小敏;駱蘇華 |
地址 | 201803上海市嘉定區(qū)金沙江西路1555弄398號(hào)7層 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種文檔向量化方法、裝置、計(jì)算設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述方法包括:將目標(biāo)文檔轉(zhuǎn)化為所述目標(biāo)文檔的向量;將所述目標(biāo)文檔的向量輸入神經(jīng)主題模型中,得到所述目標(biāo)文檔的主題向量;其中,所述神經(jīng)主題模型包括:分類(lèi)層,所述分類(lèi)層是基于樣本文檔及所述樣本文檔的分類(lèi)結(jié)果訓(xùn)練得到的,并且在訓(xùn)練后得到第一參數(shù)集;主題向量生成層,所述主題向量生成層在所述第一參數(shù)集的控制下,將所述目標(biāo)文檔的向量轉(zhuǎn)化為目標(biāo)文檔的主題向量。由此,能夠高效地訓(xùn)練和生成高質(zhì)量的長(zhǎng)文檔表示,能夠有效地改善文檔分析、識(shí)別、分類(lèi)的結(jié)果。 |
