【科技鸡汤】当电脑击败围棋手

-回复 -浏览
楼主 2019-01-15 14:29:31
举报 只看此人 收藏本贴 楼主

今天早上6点多,我朋友圈里的科技宅们就已经疯了。原因是在当年微软的“深蓝”计算机击败世界象棋大师之后,Google的人工智能系统(AI)成功击败围棋职业选手。不就是下棋么?有什么好激动的?国际象棋上能赢,围棋上赢了又有什么奇怪的?因为围棋远比国际象棋复杂,用Google提供的12秒视频来说明一下:


围棋有361个眼位,分黑白两种棋子。在棋盘上下棋,所有可能的局面加在一起是个相当惊人的数量,视频里说了,这个数字比全宇宙的原子总数加起来还要多得多。中国人喜欢说“算无遗策”,意思是把所有可能性都预先测算到了。但在围棋的问题上,大概世间没有人能够算清哪怕一局棋里的所有可能性。


如果是两个人玩石头剪刀布,不用电脑,人脑就能够计算出来所有可能的局面,一共是9种:


石头-石头

石头-剪刀

石头-布

剪刀-剪刀

剪刀-石头

剪刀-布

布-布

布-石头

布-剪刀


同样,也不需要电脑,只需要记性好一点,就可以找到最优的获胜策略:你连续观察对方的出拳组合,一定会有某种规律。比如说总是会连出两次剪刀,或者在石头输了之后必然换布---因为那是心理上的惯性,没有什么人能够真正做到随机出拳。


你看,这就是完全洞悉全局,知道所有的变化,然后找到对自己最有利的方案。感觉不错吧?但是,围棋远比石头剪刀布要复杂,比宇宙里所有的原子总数都多,是吧?注定了你不可能洞悉全局,也不知道所有的变化。计算机下五子棋没问题,五子棋棋盘小,它可以算完所有的可能,而且比人脑快。但是,面对围棋,即便计算机算力无双,也不可能计算完围棋的所有变化---它在计算速度和计算能力上的优势消失了。


那么,Google的人工智能系统是怎么赢的?


别看我,今天网上所有的科技宅都会发表文章,详细讲解Google的AlphaGo(阿尔法狗)系统用的是什么算法。你会看到“蒙特卡洛算法”、“神经网络”等等等等专业名词。总之,你根本看不懂就对了,那咱们还是接着喝鸡汤吧。


围棋棋盘上棋局千变万化,四处烽烟,但弱水三千,阿尔法狗只取一瓢。也就是说,棋盘上有十个地方短兵相接,阿尔法狗先计算哪一处赢面较高,先思考这一路棋。然后,针对这一路棋,计算可能的后续变化,从中选择出获胜可能性最高的一种。还是用Google的5秒小视频:


做左边的棋盘,然后向右延伸出无数可能的变化。每次选择变化中胜率较高的那一种,然后再计算这种变化之后的各种可能。这个过程重复下去,阿尔法狗战胜了围棋职业二段选手。更为可怕的是,阿尔法狗不像人类选手,需要休息,不能左右互博。它可以24小时无休地自己和自己玩,而且在每一局里不断学习,知道越来越多的变化,以及这些变化的结果。按照你们人类的说法,叫做“棋力见长”。今年三月,将会迎战韩国80后职业九段选手李世乭,奖金100万美金。


科技宅们欢呼他们的去,我是说,这件事情对于我们有什么好处?不能每次看到科技进展,大家欢呼一番,展望一下未来,然后就洗洗睡了。我想到了诸葛亮。


鲁迅评价诸葛亮是“多智近妖”,算无遗策说的就是诸葛亮这种人。你看华容道那一集,曹操每次坐下来呵呵一下,都被诸葛亮算到了。七擒孟获那一集,孟获的所有想法丞相都完全掌控。甚至诸葛亮都已经死了,还可以吓走司马懿;化成灰了,八阵图还能困住军团。所以,《三国演义》是本小说,根本不可以当成历史来看。


但是,对诸葛亮的喜爱和崇拜,说明我们的内心深处渴望相同的事情:有聪明的头脑,能够洞悉全局,做出最好的决策。一定程度上,我们都认为知道得越多,也就越容易决策。反过来说,为了做好决策,我们会想着去事无巨细地弄清楚每一个细节问题。这形成了我们惯常的解决问题思路,知道得多的人胜面更高。


问题在于,我们不能在所有的问题上做到统观全局,了若指掌。我应该说,大部分的事情我们都做不到。要么有时间上的限制,不允许我们无限地开地图。要么有条件上的限制,不可能让我们知道所有的细节。阿尔法狗的胜利,是思想方法上的胜利。它的胜利告诉我们:在局面非常复杂的情况下,你选择一个你较为熟悉的地方入手,只从这一个地方下手,做你最擅长做的事情,最后问题会得到解决,你能够胜出。而不是寄希望于自己是诸葛亮,可以看到全局,可以算出所有变化。不需要你同时下十路棋,在十路上都算清楚,然后都获胜。只需要你专心下好一路棋,在可能的后续手段里选择赢面较大的那一种,然后重复这么做下去。


从这里出发,我们可以想到如何教育孩子。父母想要了解和控制孩子的每一个方面,智力、美感、道德、情商、健康......要前十名,要弹钢琴,要诚实,要礼貌,要有同理心......但最后还是长成了一个熊孩子。全面控制,全面变熊。而我整个童年只有三条诫命:1、不要犯罪。2、说到要做到。3、不要给别人添麻烦。剩下的事情,全看我自己高兴。今天看起来,我和全控下成长起来的同龄人,似乎也没有差到哪里去吧?


我们也可以想到如何做事。我们想要分析完市场,分析完用户,分析完竞品,分析完行业,分析自己的长处短处软处,分析了所有却依然没有分析出多少东西来,可我们依然想了解全局,并且在这个基础上做出决策。但是,也有人说:我就想看到高校里所有的漂亮女生长什么样。于是有了Facebook。还有人说:网上那么多东西,我想立即能找到我想要的。于是有了Google。更有人说得无比简单:我想网上付款。于是有了Paypal。


在我看来,这就是阿尔法狗胜利对我们的价值。我并不把这个胜利完全看作是科技的胜利,并不理解科技宅在惊呼人类智商受到了威胁是什么意思。因为阿尔法狗并不会自己给自己编程,它所做的一切,是在验证设计者的思想。而设计者的思想来自对人类的观察---并没有能够算通全盘的围棋手,阿尔法狗的策略和一名优秀的棋手的真实策略是一样的。无非是阿尔法狗算力更强,速度更快。胜利的是人类的思想方法:单点持续突破比统观全局再动手好,并且在复杂局面下证明了这一点。


对于掌握全局的渴望让人疲惫沮丧不已,早上6点看完相关报道,我突然身心松弛,一下子就睡了过去。


题图授权基于:CC0协议


槽边往事和菜头 出品

【微信号】Bitsea

请你相信我:

我所说的每一句话,

都是错的

                       禅定时刻

1、别问我“乭”怎么念,太过复杂的一个问题。

2、视频放在腾讯,应该还没有做CDN加速,短时间太多人涌入可能会看不了,晚些时候再试试。


我要推荐
转发到