一種基于索引數(shù)據(jù)的自然語言處理方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN202111133911.8 申請日 -
公開(公告)號 CN113988078A 公開(公告)日 2022-01-28
申請公布號 CN113988078A 申請公布日 2022-01-28
分類號 G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 劉善輝;劉寶霞;孫琪;李文成;劉旭;李修嫻 申請(專利權(quán))人 北京語言大學(xué)
代理機構(gòu) 北京國坤專利代理事務(wù)所(普通合伙) 代理人 張國棟
地址 100083北京市海淀區(qū)學(xué)院路15號
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于自然語言識別技術(shù)領(lǐng)域,公開了一種基于索引數(shù)據(jù)的自然語言處理方法和系統(tǒng),所述基于索引數(shù)據(jù)的自然語言處理系統(tǒng)包括:索引形成模塊、索引連接模塊、語料向量形成模塊、中央控制模塊、訓(xùn)練集構(gòu)建模塊、模型訓(xùn)練模塊、輸入模塊、特征提取模塊、特征連接模塊、存儲顯示模塊。本發(fā)明針對漢語的潛在語義內(nèi)涵利用語言形成的象形結(jié)構(gòu)的映射邏輯建立基本維度向量,利用漢語語句的語境多樣性訓(xùn)練循環(huán)神經(jīng)網(wǎng)絡(luò)獲得詞語在復(fù)雜維度隱含語義特征及語義相關(guān)性特征中適當(dāng)向量表達(dá)的確定循環(huán)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)參數(shù);利用形成的漢語語句模型有效處理漢語每一字詞形成對應(yīng)隱性上下文維度的向量表達(dá),有利于形成與實際語義處理任務(wù)相適應(yīng)的向量維度空間。