具有多門專家混合軟演員評(píng)論家的視頻推薦
基本信息
申請(qǐng)?zhí)?/td> | CN202080005171.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN114190102A | 公開(公告)日 | 2022-03-15 |
申請(qǐng)公布號(hào) | CN114190102A | 申請(qǐng)公布日 | 2022-03-15 |
分類號(hào) | G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06F16/70(2006.01)I;G06F16/957(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 李定成;李旭;王君;李平 | 申請(qǐng)(專利權(quán))人 | 百度時(shí)代網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
代理機(jī)構(gòu) | 北京英賽嘉華知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 | 代理人 | 王達(dá)佐;王艷春 |
地址 | 100080北京市海淀區(qū)東北旺西路8號(hào)中關(guān)村軟件園17號(hào)樓二層A2 | ||
法律狀態(tài) | - |
摘要
摘要 | 本文中描述了基于強(qiáng)化學(xué)習(xí)的大規(guī)模多目標(biāo)排序系統(tǒng)的實(shí)施方式。本系統(tǒng)的實(shí)施方式可用于優(yōu)化視頻共享平臺(tái)上的短視頻推薦。用戶反饋中的多重競(jìng)爭(zhēng)排序目標(biāo)和隱式選擇偏差是現(xiàn)實(shí)世界平臺(tái)中的主要挑戰(zhàn)。為了解決這些挑戰(zhàn),將多門專家混合(MMoE)和軟演員評(píng)論家(SAC)一起集成為MMoE_SAC系統(tǒng)。實(shí)驗(yàn)結(jié)果表明,與僅基于單個(gè)策略的系統(tǒng)相比,MMoE_SAC系統(tǒng)的實(shí)施方式可大大降低損失函數(shù)。 |
