一種基于對抗網(wǎng)絡(luò)強(qiáng)化學(xué)習(xí)的問答模型優(yōu)化方法

基本信息

申請?zhí)?/td> CN201710662815.X 申請日 -
公開(公告)號 CN107423437B 公開(公告)日 2017-12-01
申請公布號 CN107423437B 申請公布日 2017-12-01
分類號 G06F16/332(2019.01)I;G06N5/02(2006.01)I 分類 -
發(fā)明人 王春輝 申請(專利權(quán))人 逸途(北京)科技有限公司
代理機(jī)構(gòu) 北京國坤專利代理事務(wù)所(普通合伙) 代理人 逸途(北京)科技有限公司
地址 100015北京市朝陽區(qū)酒仙橋路4號宏源大廈1904
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于對抗網(wǎng)絡(luò)強(qiáng)化學(xué)習(xí)的問答模型優(yōu)化方法,問答模型優(yōu)化方法的原理是在知識庫中多問一答以及一問多答題目,然后引入了對抗機(jī)制,即通過兩套智能問答系統(tǒng)交替問答實(shí)現(xiàn)問答交互,基于強(qiáng)化學(xué)習(xí)機(jī)制,最終優(yōu)化智能問答系統(tǒng)模型并具有獎勵系統(tǒng)模型。本發(fā)明設(shè)計合理,定義了對抗問答交互的優(yōu)化指標(biāo)及其計算方式,包括易響應(yīng)性、內(nèi)容豐富性、主題演變性及語義連續(xù)性,并進(jìn)一步定義了對抗問答模型優(yōu)化的獎勵函數(shù),強(qiáng)化了學(xué)習(xí),可以不斷優(yōu)化問答模型,提高問答交互的質(zhì)量,提升用戶體驗。??