随着AlphaGo战胜人类围棋冠军、AlphaStar战胜人类战队,AI已显示出在决策与对抗方面的部分超人潜力。与此同时,在工业生产、经济活动、社会管理、国防安全、以及大众生活的方方面面都涉及到最优决策的核心问题。强化学习以及相关的智能决策技术一旦可以走出游戏在现实场景中落地应用,将对生产力提升、经济持续增长、社会平稳治理产生重大促进作用。然而当前强化学习与博弈的研究大多数仍然停留在游戏环境,走出游戏环境将逐渐成为领域的共同追求。强化学习以及相关的智能决策的落地技术,很快将成为领域的研究热点。
智能决策与对抗是CCF(中国计算机学会)多智能体系统专业学组的核心研究领域。为促进科研机构和企业的交流合作,1月9日,CCF多智能体系统专业学组——智能决策对抗MeetUp暨智能决策开放研究联盟(筹)在南京景枫万豪酒店举行成立仪式。成立仪式上邀请了来自南栖仙策、第四范式、阿里巴巴等企业中智能决策的实践者和清华大学、上海交通大学的智能决策前沿学者进行了报告交流。
在成立仪式上,首先由CCF人工智能与模式识别专委秘书长、南京大学高阳教授致辞。高阳教授首先对MeetUp暨智能决策开放研究联盟的成立表示热烈祝贺,并表示智能决策技术有非常好的应用前景,但是离现实场景的落地应用还有比较大的发展周期,高阳教授寄望通过产学研联合的方式,通过联盟组织的形态,促进智能技术等方向的发展和它在产业上的落地应用,从而产生下一代革命性的进步。
随后联盟成员围绕“强化学习”、“智能决策”、“现实应用”等主题进行了特邀专题报告。
特邀报告:接近实际场景离线强化学习测试集
秦熔均 南栖仙策 联合创始人、CTO
特邀报告:Deep Reinforcement Learning: Towards Artificial General Intelligence
张崇洁 清华大学交叉信息学院 助理教授
特邀报告:数据驱动的决策优化—环境学习与强化学习
王梦硕 第四范式 资深研究员、强化学习团队负责人
特邀报告:Model-based Reinforcement Learning: Fundamentals and Advances
张伟楠 上海交通大学John Hopcroft计算机科学中心 副教授
特邀报告:AliExpress Learning-To-Rank: Maximizing Online Model Performance without Going Online
笪庆 阿里巴巴 资深算法专家