法律問題關(guān)鍵詞生成方法及其系統(tǒng)

基本信息

申請?zhí)?/td> CN201811388135.4 申請日 -
公開(公告)號 CN109543017A 公開(公告)日 2019-03-29
申請公布號 CN109543017A 申請公布日 2019-03-29
分類號 G06F16/332(2019.01)I; G06Q50/18(2012.01)I; G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 謝松縣; 曾道建; 陳仲生; 彭立宏; 高輝; 桂林; 韓冰; 唐志峰; 王寧 申請(專利權(quán))人 廣州語義科技有限公司
代理機構(gòu) 長沙國科天河知識產(chǎn)權(quán)代理有限公司 代理人 廣州語義科技有限公司
地址 510623 廣東省廣州市天河區(qū)珠江東路32號利通廣場規(guī)劃設(shè)計樓32層全層單元(自編樓層34層全層單元)的E37房
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于自然語言處理和機器學(xué)習(xí)技術(shù)領(lǐng)域,涉及一種法律問題關(guān)鍵詞生成方法,該方法包括模型訓(xùn)練和預(yù)測輸出兩個主要步驟。本發(fā)明還提供了一種法律問題關(guān)鍵詞生成系統(tǒng),該系統(tǒng)包括:模型訓(xùn)練模塊和預(yù)測輸出模塊,其中,所述模型訓(xùn)練模塊包括:訓(xùn)練集提供模塊、模型訓(xùn)練模塊以及保存模塊;所述預(yù)測輸出模塊包括:輸入與生成模塊、詞向量集生成模塊、向量輸出模塊、計算模塊、概率分布輸出模塊以及關(guān)鍵詞輸出模塊。本發(fā)明具有如下有益效果:在預(yù)測輸出之前,先對seq2seq模型進行訓(xùn)練,使得本發(fā)明可以實現(xiàn)抽取法律問題中不存在的關(guān)鍵詞;在解碼過程中引入強化學(xué)習(xí),從而顯著提高抽取的關(guān)鍵詞的準確性,并添加了注意力機制,突出了學(xué)習(xí)重點。