語(yǔ)言模型預(yù)訓(xùn)練方法、裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202110683642.6 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113408619A | 公開(kāi)(公告)日 | 2021-09-17 |
申請(qǐng)公布號(hào) | CN113408619A | 申請(qǐng)公布日 | 2021-09-17 |
分類(lèi)號(hào) | G06K9/62(2006.01)I;G06F40/289(2020.01)I;G06F40/295(2020.01)I;G06N3/04(2006.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 陳桂興;黃羿衡 | 申請(qǐng)(專利權(quán))人 | 江蘇蘇云信息科技有限公司 |
代理機(jī)構(gòu) | 江蘇坤象律師事務(wù)所 | 代理人 | 趙新民 |
地址 | 215012江蘇省蘇州市蘇州吳中經(jīng)濟(jì)開(kāi)發(fā)區(qū)越溪街道吳中大道1421號(hào)太湖軟件產(chǎn)業(yè)園智慧谷園區(qū)6號(hào)樓4樓402室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供語(yǔ)言模型預(yù)訓(xùn)練方法,包括:獲取基于第一特征初始化的第一詞向量,所述第一特征包括圖像特征;獲取隨機(jī)初始化的第二詞向量;基于所述第一詞向量與所述第二詞向量訓(xùn)練語(yǔ)言模型。結(jié)合了包括圖像和詞語(yǔ)構(gòu)成的多模態(tài)特征進(jìn)行預(yù)訓(xùn)練,提升了語(yǔ)言與現(xiàn)實(shí)事物的關(guān)聯(lián)性;降低了進(jìn)行語(yǔ)言模型預(yù)訓(xùn)練所需的語(yǔ)料,有效利用了外部知識(shí),有利于進(jìn)一步提高語(yǔ)言模型在下游任務(wù)中的使用效果。本發(fā)明還提供的語(yǔ)言模型預(yù)訓(xùn)練裝置能夠?qū)崿F(xiàn)本發(fā)明的語(yǔ)言模型預(yù)訓(xùn)練方法而具有相應(yīng)優(yōu)勢(shì)。 |
