一種改進(jìn)的語義意圖識別方法以及LSTM構(gòu)架系統(tǒng)

基本信息

申請?zhí)?/td> CN202010693872.6 申請日 -
公開(公告)號 CN111914547A 公開(公告)日 2020-11-10
申請公布號 CN111914547A 申請公布日 2020-11-10
分類號 G06F40/284(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 張宗世;汪溪;張世俠 申請(專利權(quán))人 深圳宜搜天下科技股份有限公司
代理機(jī)構(gòu) 深圳市舜立知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 深圳宜搜天下科技股份有限公司
地址 518000廣東省深圳市南山區(qū)軟件產(chǎn)業(yè)基地5棟C座403
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種改進(jìn)的語義意圖識別方法以及LSTM構(gòu)架系統(tǒng),包括以下步驟:獲取訓(xùn)練語料;中文分詞步驟;去除停用詞及標(biāo)點符號步驟;詞向量計算步驟;根據(jù)訓(xùn)練語料中特征詞的數(shù)量n以及每一特征詞的詞向量維度m,生成對應(yīng)的m*n的詞向量矩陣,將該詞向量矩陣輸入至疊加式LSTM架構(gòu)以對所述訓(xùn)練語料進(jìn)行學(xué)習(xí)訓(xùn)練;所述疊加式LSTM架構(gòu)由多個LSTM層疊加而成,首個LSTM層對所述詞向量矩陣進(jìn)行學(xué)習(xí)訓(xùn)練,生成學(xué)習(xí)訓(xùn)練后的第一特征數(shù)值矩陣,該第一特征數(shù)值矩陣作為下一個LSTM層的輸入,最后一個LSTM層對上一個LSTM層輸出的特征數(shù)值矩陣進(jìn)行學(xué)習(xí)訓(xùn)練,從而輸出經(jīng)過學(xué)習(xí)訓(xùn)練后的第二特征數(shù)值矩陣;將第二特征數(shù)值矩陣通過外接的softmax函數(shù)對其進(jìn)行分類。??