一種基于索引數(shù)據(jù)的自然語言處理方法和系統(tǒng)
基本信息
申請?zhí)?/td> | CN202111133911.8 | 申請日 | - |
公開(公告)號 | CN113988078A | 公開(公告)日 | 2022-01-28 |
申請公布號 | CN113988078A | 申請公布日 | 2022-01-28 |
分類號 | G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 劉善輝;劉寶霞;孫琪;李文成;劉旭;李修嫻 | 申請(專利權(quán))人 | 北京語言大學(xué) |
代理機構(gòu) | 北京國坤專利代理事務(wù)所(普通合伙) | 代理人 | 張國棟 |
地址 | 100083北京市海淀區(qū)學(xué)院路15號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明屬于自然語言識別技術(shù)領(lǐng)域,公開了一種基于索引數(shù)據(jù)的自然語言處理方法和系統(tǒng),所述基于索引數(shù)據(jù)的自然語言處理系統(tǒng)包括:索引形成模塊、索引連接模塊、語料向量形成模塊、中央控制模塊、訓(xùn)練集構(gòu)建模塊、模型訓(xùn)練模塊、輸入模塊、特征提取模塊、特征連接模塊、存儲顯示模塊。本發(fā)明針對漢語的潛在語義內(nèi)涵利用語言形成的象形結(jié)構(gòu)的映射邏輯建立基本維度向量,利用漢語語句的語境多樣性訓(xùn)練循環(huán)神經(jīng)網(wǎng)絡(luò)獲得詞語在復(fù)雜維度隱含語義特征及語義相關(guān)性特征中適當(dāng)向量表達(dá)的確定循環(huán)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)參數(shù);利用形成的漢語語句模型有效處理漢語每一字詞形成對應(yīng)隱性上下文維度的向量表達(dá),有利于形成與實際語義處理任務(wù)相適應(yīng)的向量維度空間。 |
