面向人機協(xié)同工作的智能體的自主學習方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN201910198409.1 申請日 -
公開(公告)號 CN109858574A 公開(公告)日 2019-06-07
申請公布號 CN109858574A 申請公布日 2019-06-07
分類號 G06K9/62(2006.01)I; G06K9/66(2006.01)I; G06N3/04(2006.01)I; G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 孟紅; 唐振坤 申請(專利權(quán))人 啟元世界(北京)信息技術(shù)服務有限公司
代理機構(gòu) 北京五洲洋和知識產(chǎn)權(quán)代理事務所(普通合伙) 代理人 啟元世界(北京)信息技術(shù)服務有限公司
地址 100192 北京市海淀區(qū)后屯路28號院1號樓4層428室
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于人工智能技術(shù)領(lǐng)域,公開了一種面向人機協(xié)同工作的智能體的自主學習方法和系統(tǒng),方法包括獲取協(xié)作數(shù)據(jù)集,根據(jù)協(xié)作數(shù)據(jù)集訓練合作智能體和模擬智能體,根據(jù)獲取的訓練后的合作智能體和模擬智能體在環(huán)境中協(xié)作生成的評估數(shù)據(jù)評估兩者是否達到評估要求,若判斷為達到評估要求,則判斷訓練后的模擬智能體是否需要新的模仿學習,若判斷為否,則結(jié)束訓練后的合作智能體的自主學習。系統(tǒng)包括合作智能體、模擬智能體和服務器。本發(fā)明通過上述方案能夠適應環(huán)境的動態(tài)變化,在類似的環(huán)境中取得同樣的性能效果,能夠模擬不同示教者的演示行為,從而使訓練的智能體能夠適應示教者的動態(tài)變化,針對不同操作水平的示教者也能達到同樣的協(xié)作效果。