融合知識圖譜的深度學(xué)習(xí)文本分類方法

基本信息

申請?zhí)?/td> CN202011097951.7 申請日 -
公開(公告)號 CN112597298A 公開(公告)日 2021-04-02
申請公布號 CN112597298A 申請公布日 2021-04-02
分類號 G06F16/36(2019.01)I;G06F40/295(2020.01)I;G06N3/08(2006.01)I;G06F16/35(2019.01)I;G06N3/04(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 劉星辰;麻沁甜;陳曉峰 申請(專利權(quán))人 上海勃池信息技術(shù)有限公司
代理機構(gòu) 上海驍象知識產(chǎn)權(quán)代理有限公司 代理人 趙俊寅
地址 201815上海市嘉定區(qū)匯源路55號8幢5層517室
法律狀態(tài) -

摘要

摘要 融合知識圖譜的深度學(xué)習(xí)文本分類方法,包括以下步驟:提取待分類文本中的實體;利用已構(gòu)建的知識圖譜,獲取實體相關(guān)隱含信息;將實體名稱和隱含信息轉(zhuǎn)換為格式化的文本,添加到原始文本的尾部,形成補充后的文本;對補充后的文本進行分詞處理,并預(yù)處理得到文本的分詞序列;查詢預(yù)設(shè)或隨機初始化的詞嵌入模型獲取分詞序列的詞嵌入矩陣,矩陣的每一行為各分詞的嵌入向量;將分詞序列的詞嵌入矩陣輸入深度學(xué)習(xí)文本分類算法,進行訓(xùn)練或者預(yù)測。本發(fā)明克服現(xiàn)有技術(shù)的不足,將知識圖譜引入到深度學(xué)習(xí)的文本分類中,通過從知識圖譜中查詢隱含信息并轉(zhuǎn)換為格式化文本,對原始文本進行信息補充,從而提升深度學(xué)習(xí)文本分類的準確性。??