一種基于語(yǔ)料領(lǐng)域的語(yǔ)料處理系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201910009322.5 申請(qǐng)日 -
公開(公告)號(hào) CN109871533B 公開(公告)日 2019-12-10
申請(qǐng)公布號(hào) CN109871533B 申請(qǐng)公布日 2019-12-10
分類號(hào) G06F17/27(2006.01); G06K9/62(2006.01); G06N3/04(2006.01); G06N3/08(2006.01) 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 孔洋洋; 陳飛宇; 朱勁松 申請(qǐng)(專利權(quán))人 北京車慧科技有限公司
代理機(jī)構(gòu) 北京市維詩(shī)律師事務(wù)所 代理人 李翔;楊安進(jìn)
地址 100044 北京市海淀區(qū)西直門外大街168號(hào)騰達(dá)大廈21層2101-2103、2105-2111
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開了一種基于語(yǔ)料領(lǐng)域的語(yǔ)料處理系統(tǒng)。該系統(tǒng)包括:第一訓(xùn)練模塊,用于根據(jù)開放領(lǐng)域語(yǔ)料訓(xùn)練第一編碼模型,根據(jù)目標(biāo)領(lǐng)域參考語(yǔ)料訓(xùn)練第二編碼模型;向量模塊,用于將目標(biāo)領(lǐng)域語(yǔ)料輸入所述第一編碼模型得到第一向量,將目標(biāo)領(lǐng)域語(yǔ)料輸入所述第二編碼模型得到第二向量,將目標(biāo)領(lǐng)域語(yǔ)料輸入第三模型得到第三向量;第二訓(xùn)練模塊,用于根據(jù)所述第一向量、所述第二向量以及所述第三向量訓(xùn)練語(yǔ)料處理模型。本申請(qǐng)的提供的技術(shù)方案,由于利用了開放領(lǐng)域的先驗(yàn)知識(shí),減少了標(biāo)簽數(shù)據(jù)使用量,使得不僅效果得到顯著提升,而且訓(xùn)練時(shí)間也大大縮短。