在德州扑克领域,人类也要被人工智能“碾压”了
人工智能无疑是2017开年以来最大的话题,先是“Master”用连胜60局的战绩横扫了世界围棋界各路顶尖高手,接着加拿大和捷克几位科学家的 一篇题为《DeepStack:无限下注扑克里的专家级人工智能》的论文表示,人工智能已经在德州扑克领域战胜了人类,而在这篇论文之前,美国卡内基梅隆大学已经发出预告:该校教授领导研发出的Libratus人工智能系统,将于当地时间1月11日,与四个顶级职业玩家玩12万手牌,并角逐20万美元的奖金,赛程为期20天。
截至北京时间1月19日中午12点,人工智能Libratus在和人类的交手中四战全胜,人类选手被四比零KO,损失约24万美元,是迄今为止输得最惨的一天。目前双方一共激战了40340手,人类选手总计亏损47万1千6百美元。其中三名选手损失均超过10万美元,最多的一位亏损18万多美元。
目前比赛已经超过了1/3的进程,人类选手虽然还有不少的时间挽回局势,但前面的比赛已经从一定程度上反映出,人工智能在“非完整信息博弈”中取得了重要的突破。
与棋类这种被称为“完整信息博弈”不同,德州扑克被称为“非完整信息博弈”,每个玩家手中的底牌只有自己知晓,其他玩家是看不到的。因此在之前的预测中,不管是专家还是牌手都认为,仅仅拥有统计和概率计算的AI是无法在德州扑克方面战胜人类的,除非它具有类似于人类“牌感”的特性。
而“DeepStack”所采用的策略正是培养人工智能出牌时的“直觉”。在运用深度学习,反复自我博弈之后,DeepStack学会了在每一个具体情境出现时进行推理。这非常接近人类玩家的“牌感”,即在当前情境下对个人牌面大小的感觉,并作出相应的决策。
与之相比,Libratus采用的是一种名为“纳什均衡”的对战策略,在这一策略里,只要其他玩家的策略保持不变,单一玩家就无法通过变换策略获益。Libratus要做的就是识别没有希望的策略,从而更快地找到纳什均衡点。经过反复的训练后,Libratus就能够忽略那些糟糕的路径。
总之,虽然距离“读懂人心”还有很远的距离,但人工智能的脚步已经让人类的想象力越来越跟不上了。
|