德扑人机对战结束:人类完败
| 来源:【字号:大 中 小】
由创新工场李开复发起的德扑人机大战, 4月10号上午正式结束。在5天比赛里,中国龙之队全部输给了人工智能“冷扑大师”,输掉792327分,堪称惨败。
在前4天比赛里,中国龙之队和冷扑大师共交战8场次,累计33000手牌。8个场次里,中国龙之队分别输掉14145分、50992分、186842分、160723分、173936分、59938分、42744分、55664分,累计输掉744984分。今天上午,中国龙之队再次输掉47343分,保持着连续惨败的势头。
比赛的结局并不出乎意料,由于之前有过AlphaGo战胜人类棋手的前车之鉴,网友对于人类选手普遍有着悲观的预测,李开复也曾经表示“对人类能赢感到悲观,赢的概率不到10%”。
事实上今年的1月份,在宾夕法尼亚州匹兹堡的Rivers赌场,CMU开发的 Libratus 人工智能系统就曾击败过人类顶级职业扑克玩家,那场比赛共持续了20天对玩了12万手,最终AI赢得了176万美元。
此次对战的双方,机器人团队是 “冷扑大师”,它是由卡内基梅隆大学(CMU)Tuomas Sandholm教授和博士生Noam Brown所开发的Libratus无限德州扑克人工智能系统;人类团队是“中国龙之队”,是由杜悦领军,成员包含了许朝军、张淮、童舟、朱亚希、王天建等顶级高手,而杜悦曾在2016年的世界德州扑克大赛WSOP的无限注德州扑克赛事中获得冠军。
AlphaGo与李世石的人机对战,让人工智能在垂直领域中的能力彻底展现了出来。但是此次参与比赛的Libratus 与其又有着不同之处。
从技术上来讲,扑克的游戏规则更像是在处理真实世界的问题。在围棋、象棋等游戏中,机器和人类在决策前可以获得全部信息。而在德州扑克中,并不知道对手与自己的手牌,这就存在着更多的不确定性。一般来讲,德州扑克要求参与比赛的团队需要学会“使诈”。
Libratus使用的策略并非基于专业玩家的经验,没有涉及到深度学习技术,而是依靠大量的数学。基于在匹兹堡超级计算机中心大约 1500 万核心小时的计算,它使用算法分析德州扑克规则,从而建立自己的策略,而且它能够在比赛中,通过预测所有未来步骤的胜率来思考自己的下一步。
“如果AlphaGo是一个超级天才,冷扑大师CMU系统其实一定程度上是一个EQ专家,是靠EQ来打败你。”李开复这样形容它,
AI利用增强学习技术,从自我对局中学习最优的扑克玩法,而避免从人类的既定模式中学习经验,这是非常重要的一点。”
不过,Libratus的算法现在也只适用于一对一的比赛,如果常见的多人比赛,那么算法策略上还需要进行升级与调整。
而且与AlphaGo一样,虽然它们都在一个垂直的领域中打败了人类代表,但是对于解决更为现实、更多广泛的问题上,并没有多少延展的能力。
人工智能如何发挥自己的商业价值?
这不仅仅是AlphaGo与冷扑大师所面临的问题,而是整个人工智能领域所需要解决的事情。在李开复看来,这需要满足三个条件:海量的数据、数据有标注、单领域。例如在金融领域,金融是虚拟的由人创造的,数据量庞大且天生带有标注。
李开复在比赛结束后讲,“人工智能已从完美信息的AlphaGo,延伸到了不完美信息的冷扑大师,人机对战基本没有悬念了,据闻AlphaGo近期即将来华和柯杰对战,其实已经不再具有科学意义了,以后更应该关注商业领域的人工智能,在金融、医疗、教育等领域产生的商业价值。”
从实验室,到与人类对战测试,到现实场景的应用,这样的一条路径在现在讲求“效率”的社会上,可能有一点点慢。但是未来人工智能的广泛应用,则是已经被诸多商业、媒体与技术大佬们所认可的么?
此外,在今天下午还有一场“名人赛”,是以李开复博士为首的创投、科技、娱乐圈各路大咖将组成六组战队,分别与冷扑大师一较高下。
这场比赛,也许结果更容易猜测出来。
来源:网易财经