Libratus赢得德扑人机大战意味着什么?

作者: 张志峰   

在我们欢度新春佳节的时候,当全家人在一起打打麻将、斗斗地主的时候,在大洋彼岸,一场“世纪巨赌”正在进行,这就是在宾夕法尼亚州匹兹堡的 Rivers 赌场进行的德州扑克人机大战。之所以称之为“世纪巨赌”,一方面因为德州扑克带有一定的赌博性质——虽然笔者认为它更接近于一种体育竞技,另一方面是因为这场比赛的重要历史意义。因为德州扑克是处理不完美信息的博弈游戏,而不完美信息是现实世界的常态,所以这场人机德扑大战,其实是机器是否有可能代替人类接管世界的一次预演。可怕的是,人类输了!

这场德州扑克人机大战总共鏖战了20天,从1月11日开始,到1月30日落幕,结果四名人类职业玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou总共输给人工智能程序 Libratus176.6万美元。Dong Kim曾在两年前击败过 Libratus的前身,而在这场比赛刚刚过半时,Kim就直言:人类已经没有真正获胜的机会了。因为他发现 Libratus每天都在进步,人类选手很难找到“他”的漏洞,即便找到一个漏洞,第二天就会消失不见。

1979年,人来首次在西洋双陆棋游戏中败给机器。1997年,国际象棋世界冠军卡斯帕罗夫输给IBM的“深蓝”,而在去年的三月份,李世石败给了阿尔法狗。笔者对卡斯帕罗夫输给深蓝那一役记忆犹新,当时我把卡斯帕罗夫奉为神一样的人物,结果竟然败给了一台电脑!在卡斯帕罗夫败给深蓝之后,虽然机器击败了国际象棋世界冠军,但媒体的舆论一直认为机器不可能在围棋领域击败人类,因为围棋的变化太多,所需要的计算量要远大于国际象棋,而且对于围棋中最重要的“势”的把握更多出于人类直觉。不过,去年李世石与阿尔法狗大战之前,笔者就预言李世石会输,因为人工智能早已今非昔比。果然不出我所料,阿尔法狗完胜李世石,其对局势的把握竟然超过了人类!而不仅是简单的计算每一步棋的优劣。但所有这些人类的惨败记录,都比不上这次输给Libratus更令人担忧,还好这只是一对一的德扑对决,如果在多人局中,人工智能会成为最大的赢家,那人类真的要准备缴械投降,把世界交给机器去管理了。

为什么这么说?Libratus赢得德扑人机大战到底意味着什么?

机器比人更可能赢得这个世界

前文说过,德州扑克是一种处理“不完美信息”的博弈游戏,他更接近于真实世界。我有一些朋友,都是绝顶聪明的“学霸”型人才,在学生时代会痴迷于围棋,但工作一段时间后都迷上了德州扑克。问其原因,他们会说随着阅历的增加,越来越发现这个世界并不是靠计算、靠智商就能赢的,更需要的是情商、是逆商、是抗压能力,也就是要智勇双全,而且还要有一点点运气。

笔者有多年的德州扑克实战经验,觉得这种游戏可以说是“一分计算、二分运气、七分心理”。德州扑克的规则非常简单,计算牌面是占据优势还是劣势,也有现成的概率表。德州扑克不是简单的比大小的游戏,而是在每一轮中尽可能的收获底池,打出最大的Value。对于一名德州扑克高手来说,能很好的判断出潜在收益并合理的把握下注比例,这就不是简单的计算了,有很大的心理因素作用,形成所谓的“紧凶型”、“松凶型”等各种风格。

德州扑克是处理“不完美信息”的博弈游戏,也就是在德州扑克对决中,任意时间的任何一个玩家,都只能观察到一部分情况。这与现实世界是一样的,不完美信息才是常态,各种看不见的隐藏信息产生了大量的不确定性。为什么那么多企业家和投资家愿意玩德州扑克,因为他们都是抗压能力强、愿意承担风险的人,他们每天的工作就是处理大量的不确定性,他们是嗜血的“鲨鱼”,在德州扑克中找到了快感。有一位企业家告诉笔者,他喜欢德州扑克的原因就是热爱那种在高压下快速做决策的感觉。另一位企业家说:“经营的专业本质是什么?我说就是判、判、判!其实商业世界里,永远没有今天的生意可做,永远是做明天的生意。”敏锐而准确的判断力,是智商和情商达到一定高度后的体现,在这方面,机器正在超越人类。

德州扑克游戏可以分为几重境界。最低一重的境界就是清楚自己牌力的大小,这是最基本的,大致记住一张德州扑克牌型概率表就够了。再上面一层是读出对手的牌,这需要一定的判断力,利用的是对手每一轮下注所透露的信息。更高一个层次是读出对方已经读出自己的牌,简单理解就是“你读我的牌,我读你的心”。由此可见,德州扑克这种规则非常简单的游戏中,却包含着复杂的博弈。Libratus赢得德扑人机大战意味着机器可以比人更能看透“人”,难道这还不够可怕吗?

笔者曾写过一篇文章“人工智能能创造超级股神吗?”其实德州扑克游戏与投资行为几乎是完全一致的,所以德州扑克高手也一定是投资高手。“超级股神”肯定能创造出巨额财富,也有一种说法,如果在线打德州扑克,对方的玩家是如Libratus一样的机器,那么这台机器就可以轻易地从游戏参与者中赢得财富。还有一个让人细思极恐的事情,笔者对德州扑克的门道“开悟”是因为读透了《孙子兵法》,也受《大秦帝国》中对战国名将的剖析所影响。这说明什么?说明德州扑克中蕴藏的智慧不仅是投资的智慧,还有管理的智慧——管理自己、管理团队,判断形势、做出决策。优秀的企业家都是智商和情商极高的人,当一台机器比人类有着更准确的判断力和快速决策能力,能够读懂他人、可以管理自己,那么让世界由这样的机器来管理岂不是更好?

机器真的是没有情感的吗?

人工智能常常为人诟病的一点是:它没有情感,所以不可能成为人,如果这个世界由冰冷的机器来主导,那太可怕了!确实,德州扑克高手都是能很好控制自己情绪的人,这里有一个专有名词“Poker Face”,就是在打牌中面无表情,无论牌好牌坏都不动声色的人。机器长着一张天生的Poker Face,这也被认为是其能战胜人类的一个原因。但这显然不是唯一的原因,因为Libratus的创建者Sandholm曾经领导开发了一个打扑克的程序Claudico,但是在一场面对数位高手的比赛中被痛殴。可见,如果没有足够的算力,一张“扑克脸”也是一张挨打的脸。

这其实引申出另一层思考,既然绝对的理性和没有任何的情绪波动并不是赢牌的决定性因素,那是不是说人工智能可以有情感呢?算法算力可以进化出情感呢?因为在德州扑克游戏中,诈唬是很重要的技术,Libratus就频繁使用诈唬。诈唬成功不仅需要自己有一张Poker Face(职业选手都能做到),而且还需要捕捉到别人的情绪,能做到后一点说明机器能感知到对手的喜怒哀乐,这是不是可以说机器也是有情感的。只是这种情感不是我们熟悉的、依托于肉身的情感,而是由算力进化出的情感。

在金融投资中,几乎每个参与者都知道这样的话——“要战胜贪婪和恐惧”、“要在别人恐惧的时候贪婪、在别人贪婪的时候恐惧”,但知道又有什么用?依然有80%的人必然成为输家。这其实说明贪婪和恐惧是相伴而生的,只存在“程度”之分,不存在“有无”之别。没有恐惧感,如何规避风险,但恐惧过甚就会畏手畏脚、贻误战机;没有贪婪之心,如何打出最大的Value,但贪婪过甚就可能忽视风险、落入圈套。贪婪和恐惧是一枚硬币的两面,共生于博弈游戏(人生就是一场赌局)中的每个参与者身上,无论是人还是机器,这能说机器没有情感吗?

通常认为,理性和情感是两种不同的心理能力,它们各在其位,各司其职。一般来说,理性还往往被看作高级的能力,享有真理在握的荣誉,而作为低级能力的情感则被看作对真理的干扰。而事实上,这样的划分只具有相对的意义,理性和情感两者之间并没有高低之分,而其中的每一者又可以做出高低的划分。这样看来,人性实际上被分为了两个部分,一是低级部分,也就是低级的理性和情感;二是高级部分,也就是高级的理性和情感。

我知道这样一对情侣,两人一起看电影,当看一些爱情片时,女的会哭得梨花带雨,而男的会哈哈大笑;而看其他类型的影片,比如《辛德勒名单》,男的会热泪盈眶,女的则无动于衷;当然后来这两个人分手了。但是你能说男的没情感吗?他只是觉得男欢女爱的故事触动不了他,甚至有点好笑,但是与宇宙众生息息相通的大爱和大慈悲让他震撼、令他感动。可见情感和理性是有高低之分的,当你说一个人没有情感的时候,只不过是他的理性可以轻松驾驭你所感知的情感,而你的理性体验不到他所感知的情感。这说明什么?说明机器并不是没有情感,当人的理性达不到它的算力,根本体验不到“他”的情感。人工智能的发展,是由算力算法进化出更高级的情感,但你感知不到而已。当“深蓝”战胜卡斯帕罗夫,人们见识了机器的绝顶聪明;当阿尔法狗战胜李世石,人们发现了机器的大格局观;当Libratus赢得德扑人机大战,人们应该会注意到机器的高级情感。可见,人工智能的进化速度要远远超过人类,直到奇点临近。

最后,再回到那个常问到的问题,真正的人工智能会出现吗?人类会被人工智能取代吗?很多人会说机器是人制造的,所以机器不可能取代人类。那么,人类是谁制造的?是神吗?那为什么我们眼中只有人,而感知不到神?人为什么将神取代了?真正的人工智能是“一个不断改变自己的程序,而且这种改变也不是一个固定的程序”,当前的人工智能已经是不断改变自己的程序,像机器学习,总有一天这样的改变也不是能由人所能理解和控制的固定程序,人工智能将取代人类。其实,人类这东西也只不过是宇宙大爆炸后机缘巧合产生的一种族群,竟然统治了这个星球这么长时间,也够本了。

以上文字仅代表作者个人观点,并不代表金评媒立场,禁止转载。
张志峰
财经媒体人,长期游弋于金融圈和媒体圈,互联网金融观察者。
最新评论
    查看更多评论

    扫码或搜索 "JPMMedia"
    关注金评媒微信公众号
    互联网金融媒体 | www.jpm.cn 关于金评媒 加入我们 订阅 官方微博