融合知識圖譜的深度學(xué)習(xí)文本分類方法
基本信息
申請?zhí)?/td> | CN202011097951.7 | 申請日 | - |
公開(公告)號 | CN112597298A | 公開(公告)日 | 2021-04-02 |
申請公布號 | CN112597298A | 申請公布日 | 2021-04-02 |
分類號 | G06F16/36(2019.01)I;G06F40/295(2020.01)I;G06N3/08(2006.01)I;G06F16/35(2019.01)I;G06N3/04(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 劉星辰;麻沁甜;陳曉峰 | 申請(專利權(quán))人 | 上海勃池信息技術(shù)有限公司 |
代理機構(gòu) | 上海驍象知識產(chǎn)權(quán)代理有限公司 | 代理人 | 趙俊寅 |
地址 | 201815上海市嘉定區(qū)匯源路55號8幢5層517室 | ||
法律狀態(tài) | - |
摘要
摘要 | 融合知識圖譜的深度學(xué)習(xí)文本分類方法,包括以下步驟:提取待分類文本中的實體;利用已構(gòu)建的知識圖譜,獲取實體相關(guān)隱含信息;將實體名稱和隱含信息轉(zhuǎn)換為格式化的文本,添加到原始文本的尾部,形成補充后的文本;對補充后的文本進行分詞處理,并預(yù)處理得到文本的分詞序列;查詢預(yù)設(shè)或隨機初始化的詞嵌入模型獲取分詞序列的詞嵌入矩陣,矩陣的每一行為各分詞的嵌入向量;將分詞序列的詞嵌入矩陣輸入深度學(xué)習(xí)文本分類算法,進行訓(xùn)練或者預(yù)測。本發(fā)明克服現(xiàn)有技術(shù)的不足,將知識圖譜引入到深度學(xué)習(xí)的文本分類中,通過從知識圖譜中查詢隱含信息并轉(zhuǎn)換為格式化文本,對原始文本進行信息補充,從而提升深度學(xué)習(xí)文本分類的準確性。?? |
