一種基于對(duì)抗網(wǎng)絡(luò)強(qiáng)化學(xué)習(xí)的問(wèn)答模型優(yōu)化方法

基本信息

申請(qǐng)?zhí)?/td> CN201710662815.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN107423437B 公開(kāi)(公告)日 2017-12-01
申請(qǐng)公布號(hào) CN107423437B 申請(qǐng)公布日 2017-12-01
分類號(hào) G06F16/332(2019.01)I;G06N5/02(2006.01)I 分類 -
發(fā)明人 王春輝 申請(qǐng)(專利權(quán))人 逸途(北京)科技有限公司
代理機(jī)構(gòu) 北京國(guó)坤專利代理事務(wù)所(普通合伙) 代理人 逸途(北京)科技有限公司
地址 100015北京市朝陽(yáng)區(qū)酒仙橋路4號(hào)宏源大廈1904
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于對(duì)抗網(wǎng)絡(luò)強(qiáng)化學(xué)習(xí)的問(wèn)答模型優(yōu)化方法,問(wèn)答模型優(yōu)化方法的原理是在知識(shí)庫(kù)中多問(wèn)一答以及一問(wèn)多答題目,然后引入了對(duì)抗機(jī)制,即通過(guò)兩套智能問(wèn)答系統(tǒng)交替問(wèn)答實(shí)現(xiàn)問(wèn)答交互,基于強(qiáng)化學(xué)習(xí)機(jī)制,最終優(yōu)化智能問(wèn)答系統(tǒng)模型并具有獎(jiǎng)勵(lì)系統(tǒng)模型。本發(fā)明設(shè)計(jì)合理,定義了對(duì)抗問(wèn)答交互的優(yōu)化指標(biāo)及其計(jì)算方式,包括易響應(yīng)性、內(nèi)容豐富性、主題演變性及語(yǔ)義連續(xù)性,并進(jìn)一步定義了對(duì)抗問(wèn)答模型優(yōu)化的獎(jiǎng)勵(lì)函數(shù),強(qiáng)化了學(xué)習(xí),可以不斷優(yōu)化問(wèn)答模型,提高問(wèn)答交互的質(zhì)量,提升用戶體驗(yàn)。??