一種基于語(yǔ)料領(lǐng)域的語(yǔ)料處理系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN201910009322.5 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN109871533B | 公開(公告)日 | 2019-12-10 |
申請(qǐng)公布號(hào) | CN109871533B | 申請(qǐng)公布日 | 2019-12-10 |
分類號(hào) | G06F17/27(2006.01); G06K9/62(2006.01); G06N3/04(2006.01); G06N3/08(2006.01) | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 孔洋洋; 陳飛宇; 朱勁松 | 申請(qǐng)(專利權(quán))人 | 北京車慧科技有限公司 |
代理機(jī)構(gòu) | 北京市維詩(shī)律師事務(wù)所 | 代理人 | 李翔;楊安進(jìn) |
地址 | 100044 北京市海淀區(qū)西直門外大街168號(hào)騰達(dá)大廈21層2101-2103、2105-2111 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開了一種基于語(yǔ)料領(lǐng)域的語(yǔ)料處理系統(tǒng)。該系統(tǒng)包括:第一訓(xùn)練模塊,用于根據(jù)開放領(lǐng)域語(yǔ)料訓(xùn)練第一編碼模型,根據(jù)目標(biāo)領(lǐng)域參考語(yǔ)料訓(xùn)練第二編碼模型;向量模塊,用于將目標(biāo)領(lǐng)域語(yǔ)料輸入所述第一編碼模型得到第一向量,將目標(biāo)領(lǐng)域語(yǔ)料輸入所述第二編碼模型得到第二向量,將目標(biāo)領(lǐng)域語(yǔ)料輸入第三模型得到第三向量;第二訓(xùn)練模塊,用于根據(jù)所述第一向量、所述第二向量以及所述第三向量訓(xùn)練語(yǔ)料處理模型。本申請(qǐng)的提供的技術(shù)方案,由于利用了開放領(lǐng)域的先驗(yàn)知識(shí),減少了標(biāo)簽數(shù)據(jù)使用量,使得不僅效果得到顯著提升,而且訓(xùn)練時(shí)間也大大縮短。 |
