面向人機協(xié)同工作的智能體的自主學(xué)習(xí)方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN201910198409.1 申請日 -
公開(公告)號 CN109858574B 公開(公告)日 2019-12-17
申請公布號 CN109858574B 申請公布日 2019-12-17
分類號 G06K9/62(2006.01); G06K9/66(2006.01); G06N3/04(2006.01); G06N3/08(2006.01) 分類 計算;推算;計數(shù);
發(fā)明人 孟紅; 唐振坤 申請(專利權(quán))人 啟元世界(北京)信息技術(shù)服務(wù)有限公司
代理機構(gòu) 北京五洲洋和知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 啟元世界(北京)信息技術(shù)服務(wù)有限公司
地址 100192 北京市海淀區(qū)后屯路28號院1號樓4層428室
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于人工智能技術(shù)領(lǐng)域,公開了一種面向人機協(xié)同工作的智能體的自主學(xué)習(xí)方法和系統(tǒng),方法包括獲取協(xié)作數(shù)據(jù)集,根據(jù)協(xié)作數(shù)據(jù)集訓(xùn)練合作智能體和模擬智能體,根據(jù)獲取的訓(xùn)練后的合作智能體和模擬智能體在環(huán)境中協(xié)作生成的評估數(shù)據(jù)評估兩者是否達到評估要求,若判斷為達到評估要求,則判斷訓(xùn)練后的模擬智能體是否需要新的模仿學(xué)習(xí),若判斷為否,則結(jié)束訓(xùn)練后的合作智能體的自主學(xué)習(xí)。系統(tǒng)包括合作智能體、模擬智能體和服務(wù)器。本發(fā)明通過上述方案能夠適應(yīng)環(huán)境的動態(tài)變化,在類似的環(huán)境中取得同樣的性能效果,能夠模擬不同示教者的演示行為,從而使訓(xùn)練的智能體能夠適應(yīng)示教者的動態(tài)變化,針對不同操作水平的示教者也能達到同樣的協(xié)作效果。