多智能体强化学习


随着2014年,Google公司提出深度强化学习以来,学术界和企业界投入大量人力物力、产出了举世瞩目的成果。比如AlphaGo击败了围棋世界冠军,AlphaStar战胜了星际争霸游戏职业选手等。本项目要解决的是通过强化学习技术,使得多智能体(比如多个王者荣耀的英雄,多个无人机)之间合作更加高效。本研究方向关注多智能合作的两个关键问题,多智能体通信以及多智能体协同。多智能体通信是指如何通过通信使得多智能体更好的进行合作,解决多智能合作过程中的信息不完全问题。多智能体协同是指如何在通信不顺畅或者通信中断的情况下如何进行合作,采用集中训练分布式执行这一方式并结合价值分解方法和注意力机制,让多智能体不通过通信就能获得比较好的协同效果。本研究方向采用多智能体强化学习技术用于星际争霸、篮球、足球等游戏中的人工智能训练。

近期实验室在多智能体强化学习方面的工作发表在NeurIPS 2022 (Spotlight, top 5%)以及NeurIPS 2023等会议上。





联邦学习研究方向待补充。