面向人機協(xié)同工作的智能體的自主學(xué)習(xí)方法和系統(tǒng)
基本信息
申請?zhí)?/td> | CN201910198409.1 | 申請日 | - |
公開(公告)號 | CN109858574B | 公開(公告)日 | 2019-12-17 |
申請公布號 | CN109858574B | 申請公布日 | 2019-12-17 |
分類號 | G06K9/62(2006.01); G06K9/66(2006.01); G06N3/04(2006.01); G06N3/08(2006.01) | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 孟紅; 唐振坤 | 申請(專利權(quán))人 | 啟元世界(北京)信息技術(shù)服務(wù)有限公司 |
代理機構(gòu) | 北京五洲洋和知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 啟元世界(北京)信息技術(shù)服務(wù)有限公司 |
地址 | 100192 北京市海淀區(qū)后屯路28號院1號樓4層428室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明屬于人工智能技術(shù)領(lǐng)域,公開了一種面向人機協(xié)同工作的智能體的自主學(xué)習(xí)方法和系統(tǒng),方法包括獲取協(xié)作數(shù)據(jù)集,根據(jù)協(xié)作數(shù)據(jù)集訓(xùn)練合作智能體和模擬智能體,根據(jù)獲取的訓(xùn)練后的合作智能體和模擬智能體在環(huán)境中協(xié)作生成的評估數(shù)據(jù)評估兩者是否達到評估要求,若判斷為達到評估要求,則判斷訓(xùn)練后的模擬智能體是否需要新的模仿學(xué)習(xí),若判斷為否,則結(jié)束訓(xùn)練后的合作智能體的自主學(xué)習(xí)。系統(tǒng)包括合作智能體、模擬智能體和服務(wù)器。本發(fā)明通過上述方案能夠適應(yīng)環(huán)境的動態(tài)變化,在類似的環(huán)境中取得同樣的性能效果,能夠模擬不同示教者的演示行為,從而使訓(xùn)練的智能體能夠適應(yīng)示教者的動態(tài)變化,針對不同操作水平的示教者也能達到同樣的協(xié)作效果。 |
