面向人機(jī)協(xié)同工作的智能體的自主學(xué)習(xí)方法和系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN201910198409.1 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN109858574B | 公開(公告)日 | 2019-12-17 |
申請(qǐng)公布號(hào) | CN109858574B | 申請(qǐng)公布日 | 2019-12-17 |
分類號(hào) | G06K9/62(2006.01); G06K9/66(2006.01); G06N3/04(2006.01); G06N3/08(2006.01) | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 孟紅; 唐振坤 | 申請(qǐng)(專利權(quán))人 | 白楊時(shí)代(北京)科技有限公司 |
代理機(jī)構(gòu) | 北京五洲洋和知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 啟元世界(北京)信息技術(shù)服務(wù)有限公司 |
地址 | 100192 北京市海淀區(qū)后屯路28號(hào)院1號(hào)樓4層428室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明屬于人工智能技術(shù)領(lǐng)域,公開了一種面向人機(jī)協(xié)同工作的智能體的自主學(xué)習(xí)方法和系統(tǒng),方法包括獲取協(xié)作數(shù)據(jù)集,根據(jù)協(xié)作數(shù)據(jù)集訓(xùn)練合作智能體和模擬智能體,根據(jù)獲取的訓(xùn)練后的合作智能體和模擬智能體在環(huán)境中協(xié)作生成的評(píng)估數(shù)據(jù)評(píng)估兩者是否達(dá)到評(píng)估要求,若判斷為達(dá)到評(píng)估要求,則判斷訓(xùn)練后的模擬智能體是否需要新的模仿學(xué)習(xí),若判斷為否,則結(jié)束訓(xùn)練后的合作智能體的自主學(xué)習(xí)。系統(tǒng)包括合作智能體、模擬智能體和服務(wù)器。本發(fā)明通過上述方案能夠適應(yīng)環(huán)境的動(dòng)態(tài)變化,在類似的環(huán)境中取得同樣的性能效果,能夠模擬不同示教者的演示行為,從而使訓(xùn)練的智能體能夠適應(yīng)示教者的動(dòng)態(tài)變化,針對(duì)不同操作水平的示教者也能達(dá)到同樣的協(xié)作效果。 |
