新氦類腦智能 >
資訊洞察 >
活動信息 >
【10.27直播】新氦技術(shù)沙龍第21期——基于種群的多智能體強(qiáng)化學(xué)習(xí):算法與系統(tǒng)
2021/10/13
【10.27直播】新氦技術(shù)沙龍第21期——基于種群的多智能體強(qiáng)化學(xué)習(xí):算法與系統(tǒng)
活 動 背 景
Background
目前,多智能體深度強(qiáng)化學(xué)習(xí)在電子游戲等特定領(lǐng)域取得了突破性進(jìn)展。其中最關(guān)鍵是基于課程學(xué)習(xí)不斷調(diào)整適應(yīng)智能體水平的新對手,以實現(xiàn)智能體穩(wěn)定的水平提升。本期內(nèi)容將介紹多智能體強(qiáng)化學(xué)習(xí)的背景,主流基于種群的多智能體強(qiáng)化學(xué)習(xí),包括自對弈及結(jié)合博弈論或圖論的算法。由于為了在系統(tǒng)層面支撐起深度強(qiáng)化學(xué)習(xí)研究與應(yīng)用的訓(xùn)練系統(tǒng)越來越復(fù)雜,因此本期將進(jìn)一步探討:1)針對多智能體深度強(qiáng)化學(xué)習(xí)更復(fù)雜的訓(xùn)練、評估和采樣需求;2)如何解耦數(shù)據(jù)流與任務(wù)流;3)在底層計算集群上提供更高層次的實現(xiàn)接口;4)為相關(guān)研究與應(yīng)用在研發(fā)的門檻和效率上取得平衡。




滬公網(wǎng)安備 31011002003093號