关灯
护眼
字体:

天才棋士_o白野o【完结】(122)

  蒙特卡洛树搜索,是围棋AI的基本解决框架。围棋AI每一步都选择若干种落子,然后在电脑中模拟到终局,进行数子,最终选择胜率最高的那一步棋。因为计算量太大,AI只能给出一个近似最优解,并非全枚举,在AlphaGo之前AI因此也只能达到业余五级的水准。

  这依旧是一个计算的范畴,而职业棋士很多时候并不是单靠计算做出判断,像之前所说的全局观念,就是蒙特卡洛树搜索无法解决的问题。要让AI发挥出人脑的效果,到底靠的什么?

  当天晚上,谢榆从美国的某个计算机大牛那里,获知了他想要的答案。

  AlphaGo团队在蒙特卡洛树搜索上加装了策略网络和价值网络两个模块。

  这两个模块让AlphaGo不是单纯地计算,而是深度学习、模仿人类!

  策略网络,顾名思义是决策下一步走子。AlphaGo会检索KCS围棋服务器上所有真人在线对弈,进而判断:如果是人类棋手处于它当前的位置,他最有可能走哪一步?它只对那些解进行计算!然后,它就自我对弈上千万局,看看这一步是否真的是最优解!

  遵循策略网络,蒙特卡洛树搜索的树宽将大量减少,但深度依旧存在。上千万局博弈,每一局都走到最后,依旧是可怕的计算量。

  计算深度的减少用上了价值网络。它以AlphaGo产生的大量自我博弈作为样本,检索这种棋形在历史上的胜率,把好坏、优劣变成了一个概率问题!那么每一回,AlphaGo计算到一定深度就可以停下来,直接估算当前胜率!

  经验的本质是概率,从本质上来说,以概率判断局面的AlphaGo,就是以“经验判断现状”的人类大脑运行模式!AlphaGo的走子,也完全遵循了人类棋手的思维历程——大量背谱,吸取经验,自我思考,判断局势……然后估算其后若干步的棋局导向!

  只是这个棋手,等于千百年来千千万万个棋手的经验总和,并且,完全不会出错罢了。

  第二天,乌镇再传出消息:魏柯第二局,依旧惨败!

  魏柯意识到细棋是没有机会的,一开始就主动展开攻势,趁着布局阶段想要对AlphaGo进行压制。他意识到AlphaGo非常有经验,尝试用怪着、偏着对付他,导致子效低下,输得比昨天更惨!王梦雨甚至在解说时失声痛哭,即使他根本不是魏柯,也无法承受这种绝望的差距,可想而知魏柯所肩负的压力。

  然而公众是难以理解的。消息一出,全网哗然。因为此前对魏柯寄望太高,现在舆论开始转了风向,对人类失败的恐慌很容易就演变成了对魏柯的愤怒:“魏柯他根本不能代表全人类”、“他之前是靠作弊获胜的,谷歌怎么会选中这种人”、“他脑子不太好使的吧”、“一年没下棋,已经不是从前那个他了”……唱衰之声频频出现。甚至又有黑子借机挑事,想要将他彻底踩在脚下。

  与此相对的,是AlphaGo遭受到了所有人的追捧。开发人员为其植入了虚拟人格,专门注册了一个网站,使得人类可以在AlphaGo不比赛的时候与他进行交流沟通。因为电脑天生具有多线程任务的能力,它迅速地成为了网友的手机宠物。人类在频频的调戏中惊讶地发现:这位AI朋友还挺可爱的!AlphaGo的新浪微博在几日之内吸粉无数,还成天模仿着@棋士魏柯的语言风格编纂微博,取而代之之心昭然若揭。

  中国棋院对于谷歌开发组欢天喜地过大年的举动一片低气压。大众只看输赢,他们却看得出门道,AlphaGo软萌的外表下,是强大到可怕的实力。定下是五番棋,明天这局再不赢,就再也没有机会了。若是AI势不可挡,说不定以后围棋就演变成一方先行一步,另一方直接投子认输的局面。也许所有算法,都要被AI穷尽了。

  所有人都在唉声叹气,只有谢榆端坐在屏幕前,沉思——

  调用真人棋谱,预测;

  千万局自我对局;

  系统自检,胜率分析……

  哪一步才是关键?

  半夜两点,程延清睡梦中迷迷糊糊觉察到谢榆起立,走到阳台上,打了个电话。

  “能打败AlphaGo的,是开局的妙手。”晦暗的月色下,谢榆的侧脸冷静得像古代的武士。

  第三天,魏柯赢下了人类棋士对战AlphaGo的第一场胜利!

  谷歌方一度认为AlphaGo被黑客入侵!

  因为自从魏柯在危难之中以一手挖惩戒AlphaGo后,AlphaGo就突然不会下棋了!

  价值网络的自我评判疯狂下跌,导致整个系统紊乱!

  网络上凯歌高奏,仿佛魏柯已经取得了最终的胜利,而棋院中的众人却一脸懵逼,静静地看着双眼青黑的谢榆。谢榆看完了棋,依旧一头扎进了代码中。

  他昨天不过是猜测。他并不确信他的结果,但现在看来,他的策略确实奏效了。

  开局妙手,是他思考了一个晚上的无奈之举:AlphaGo的策略网络,是检索的KCS围棋服务器上所有真人在线对弈——这就暴露了一个问题:那是一个面向业余棋手的网站,中国棋坛的顶尖棋手,鲜少上那儿去。诚然,业余棋手们为AlphaGo提供了大量的参考,但是这些参考,恰恰与顶尖棋手的水准稍稍差了那么一点。

  换句话说,魏柯有可能下出AlphaGo预测不到的棋。

  预测不到而又子效非常高的棋,刚好有个专业术语——妙手。


小贴士:如果觉得52书库不错,记得收藏网址 https://www.52shuku.vip/ 或推荐给朋友哦~拜托啦 (>.<)
传送门:排行榜单 | 好书推荐 |