-
李喆六段:这两盘棋 ,没人会比李世石做得更好!
关键字: 围棋人机大战谷歌围棋李世石李世石AlphaGo李世石对战AlphaGo人工智能AlphaGo算法【本文转载自微信号“喆理围棋”。“喆理围棋”沙龙由李喆六段发起,清华围棋文化交流与研究基金主办。旨在以沙龙的形式,吸引志同道合的朋友,从文化、哲学等方面出发,共同思考、交流意见,探寻围棋的价值与本质。】
引言
我不知道这篇文章要怎么开头。
没有言语能够形容我现在的心情。
19年前,围棋入门课,用十个棋子在中腹摆出两眼活棋。
4年前,挥别围棋赛场,进了大学。
怎么也想不到,在今天,竟然会为了一张棋谱,我哭了。
哭得很开心。
我不知道这世界上还有几人与我此时有同样的感受。或许有,绝不会多。
我不奢求读到此文的人都能理解我在说什么。
但是,我要把我看到的记下来。
不是纪念,而是感激。
我发现,在情绪中,我只能记录下我的情绪,却无法写出这情绪的由来。虽然我自认为清楚地知道它的由来。
写一篇抒情的文章很容易,但没有什么太大的价值。我看到的东西,这似乎应该用“美”来表示的这种东西,难以抽象成语言将它描绘。于是,我只好等到情绪消退,从理性出发,试着把因果呈现。
这样,会有更多人享受到这种美吗?
我不知道。
或许可以试试。
深夜。终于可以动笔。
2016年3月10日,AlphaGo对阵李世石,人机大战第二局。
对于这盘棋,虽然分歧远小于上一盘,但职业棋手之间仍然有许多互不相同的看法。
或许随着时间的前行,这些看法最终会汇流为一。但在今天,在故事发生的当下,面对经验以外的事情,人类观点的多元无法避免。我的观点同样也是这多元中的一元,正是人类思想的多元性丰富了我们的世界。
在敲完上面这一串字之后,我原本准备神游到中午的状态,从头梳理一遍我的所见所思,将我看到的那无法用语言直接描述的感受的由来渐次呈现。
然而,事实教育我们不要在写文章的时候刷微信微博新闻朋友圈……
一个小时之后,我不得不再次改变写法。
这两盘棋 ,没人会比李世石做得更好!
是的,这就是我文章的标题。
我知道我说服不了所有人。这样的标题也不是我一向的风格。
但是,在铺天盖地的对李世石的质疑声中,我必须把我看到的讲出来。
因为,我不相信这些质疑是出于恶意。我只能理解为有些我看到了的东西人们没有看到。每个人的认知体系不同,对待事物的态度也不尽相同,对此倒没什么好指责的。
在小说《冰与火之歌》之中,有一场“黑水河之战”。守方的指挥者是一个侏儒,用尽了各种策略,最后亲上战场被割掉了鼻子,终于抵挡住了对方的进攻,拯救了那座城市。但在战争结束后,他被解除了职位,甚至成为阶下囚。他所做的一切,人们并没有看到。
《冰与火之歌》电视剧截图
没有关系,我把我看到的东西讲出来。
我只希望,读者能耐心看完这一章,再做判断。
在阅读本章之前,建议先读昨天那篇《【火线速递】——李世石的策略与AlphaGo的弱点》,会帮助理解此文。
0. 莫须有的“协议禁劫”
这一节是本文最没有价值的部分,也是我最不想写的部分。谣言自破,本不需我来回应。但一方面我对谣言扩散到圈外而感到羞愧,另一方面也能帮助大家稍微理解AlphaGo的算法。
关于“协议禁劫”的质疑大概来自“AlphaGo七盘棋都没出现劫争”这一说法。
或许DeepMind会官方回应此事,或许在接下来的对局谣言自散。
但不需要这些证明,难道我们就不能分辨了吗?
由弱到强,我先给出三个回应。
1,懂围棋的朋友,你真的相信李世石作为一名世界顶级棋士在代表人类出战的历史时刻会签这样的协议?不懂围棋的朋友,你真的相信谷歌团队会签这种改变围棋玩法的协议?
2,AlphaGo的算法决定了他在不打劫就能获胜的条件下会尽量避免劫争,因为优势下的劫争增加了搜索的不确定性,常常会使他对胜率的估计降低。这也是我在上一篇里谈到的逃避劫争问题的本质。但是,非胜不可的劫,电脑必然会打。可逻辑推断或参考第3条。
3,难道不能去看一眼去年10月AlphaGo对樊麾的棋谱吗?第三局、第五局,都出现了劫争。其中第三局马上消劫形成转换;第五局劫争过程持续18手,亦形成转换。
在围棋受到空前关注的时刻,我认为圈内人有辟谣的义务,不助长谣言则是底线。
1. AlphaGo算法的关键特点
很多人说发现了AlghaGo的很多失误,不能理解这么弱的一个AI怎么能赢李世石,所以blablabla……
如果你看过上一篇分析仍然这么认为,那可能是我没有讲清楚。绝大多数对AlphaGo实力的错误估计,都是因为对AlphaGo算法原理的不了解。
强调一下:
AlphaGo的算法决定其落子的决策基于“胜率”而不是“最优”!
所有质疑AI失误的同学请记住这一点。
这也是这篇文章整个分析的逻辑起点。
这意味着,我们人类所谓的“失误”对于”AI“而言很可能不是失误。
2. 第一局李世石在做什么?
第一局下完,有棋手提出“李世石心态不对,太过急躁,电脑计算力肯定强,应该慢慢下跟它拼形势判断,它的判断力肯定不行”。
说得好。李世石第二局就是这么做的。
只是,在第一局之前,几乎没有人认为李世石的乱战能力会不如电脑。
在上一篇中,我谈到在赛前对AlphaGo算法的分析认为,它在面对“开放性复杂局面”的时候可能会变弱,因为深度学习加蒙特卡洛的剪枝和搜索在面对开放式复杂局面时可能会变得失效。
第一局,李世石上来先试探了无谱布局(你说李世石没用什么策略?好吧),然后马上导入开放式复杂局面,呈现出六七块棋纵横交错的场景。
结果,第一策略失败。起码下到中盘收兵为止,赛后职业棋手基本上都认为李世石亏损。
如果是我在场上,或许也会在第一盘选择这样的第一策略,但我只会考虑一盘棋试一个策略,毕竟有五盘棋的空间。
然而,李世石在中盘及时收手,第77、79手主动停战转向收空,导入细棋局面。
他在第一盘竟然试探了两个策略!
那么,你可能会问,如果李世石原本形势不利,怎么能导向细棋甚至反而领先呢?那不是说明AI出现了足以颠倒胜负的错误吗?
在昨天,对此问题我还不能完全肯定地回答,但在今天我可以确认:
第一局所谓李世石的领先和细棋都是人类经验带来的错觉!从开局战斗到最后结束,一直是AlphaGo优势!
这一判断也符合AlphaGo自己的胜率走势。
在上一篇,我提出AlphaGo对局面的判断是基于一手对方没有算到的严厉手段(102),我们认为它在左上的缓手(80)和左下的恶手(86),确实并不肯定好,但在AI看来却是最接近胜利的选择。观战棋手认为左下之后黑棋已经逆转甚至大胜,是由于
1) “左下白棋大亏”
2)对第102手没有充分的准备。
3)人类的傲慢自负。
然而,
1)是一个依靠经验的局部判断,并不具有能构成证明的准确性;
2)AlphaGo的局面判断基于有102这一手;
3)人类的情绪降低了判断能力。
102手一出,李世石长考无果,局部大亏。然而,这个大亏根本就在AlphaGo的判断之中,对它而言,这只是搜索树中可能出现的一个分支。
至于很多人认为后面黑右下走好还能收——确实是能收,但恐怕不能赢了。当然,跟我下或许你能赢,但对AlphaGo不行,这是从AlphaGo的算法和下法的逻辑推出来的。当然,这个结论的得出依赖于AlphaGo在对阵人类时这套方法不会出现问题。基于这两天它这套方法在对人类时还没有出现任何问题(关于失误问题请看上一章或上一篇),我只能极大程度地相信它。这个信念只有在AlphaGo这套方法在对阵人类出现问题而败北时才会动摇,才会需要去寻找它的问题在哪里,以及人类能够怎么去利用。
有趣或者说可怕的是,对于人类而言无比闪耀的“胜负手”102,包含了如此多的计算、判断和预谋,对于AI而言却只是它这一局平凡的93手棋中平凡的一手。
-
本文仅代表作者个人观点。
- 责任编辑:陈轩甫
-
“特朗普想搞新世界秩序,但美元要先遭殃” 评论 29“因为普京不喜欢”,特朗普将自家俄乌特使降格 评论 48英首相:向乌派遣维和部队的计划进入“行动阶段” 评论 419涉多个知名品牌!翻新卫生巾、纸尿裤竟被二次销售 评论 253“争夺软实力确有挑战,但中国产品表现堪称惊艳” 评论 49最新闻 Hot
-
欧尔班提要求:欧盟应驱逐索罗斯代理人
-
“美国无权决定伊朗的外交政策,那个时代在1979年就结束了”
-
美国靠不住,欧盟想要自己建
-
英首相:向乌派遣维和部队的计划进入“行动阶段”
-
“美国之音被噤声”
-
特朗普用18世纪“战时法律”驱逐非法移民
-
“特朗普认为南非政府反白人、反美以”
-
“看起来像战区”,龙卷风席卷美国多地致32死
-
武契奇发声:谎言推动的“颜革”是无法获胜的
-
滞留太空9个月的美国宇航员,要回家了
-
这一次,特朗普挥刀“自割喉舌”
-
美国驱逐南非大使:他是“种族主义政客”,憎恨美国和特朗普
-
涉多个知名品牌!翻新卫生巾、纸尿裤竟被二次销售
-
加拿大新总理:这太疯狂了
-
“争夺软实力确有挑战,但中国产品表现堪称惊艳”
-
美国确认将韩国列入,“拜登干的”
-