服务器
    作者:徐鹏

    人工智能崛起 AlphaGo拿什么赢李世石?

         [ 中关村在线 原创 ] 暂无评论

      嗯,神经学习大概就是这么个事儿。回到AlphaGo,这种AI程序拥有两种深度神经网络,分别是策略网络(Policy Network)和估值网络(Value Network),二者相互配合,选出胜算更大的一步棋,把非常复杂的搜索树减少到可操作的规模。简单来说,它不需要每次都考虑数百种可能,而是在策略网络提供的几十步更好的走法中,选择最好的那个。你可以理解为,这是两个“大脑”在合作下棋,一个负责分析局势,另一个负责走出和高手走法最像的一步,更贴近人类的思考方式。

    人工智能崛起 AlphaGo拿什么赢李世石?
    AlphaGo深度神经网络

      在上述提到的优化算法中,蒙特卡洛树搜索(Monte Carlo Tree Search)起到了关键作用。大家先别晕,这其实就是“随机走,定输赢”。举个例子,AlphaGo会模拟A和B两种走法,假设按照A走下去完成500局,赢了300次,按照B走下去同样完成500局,赢了400次。这种走法都是随机,最后结果显示B占优,那么程序就会选择B作为下一步棋。

      通过加入蒙特卡洛树搜索算法,AlphaGo的实力提升明显。随着开发人员的不断优化,这种算法很可能接近或超过人类职业选手。

      谷歌在博客中提到:“我们选择将围棋‘分解’,用改进的搜索树算法结合深度神经网络开发出AlphaGo这一程序,通过将棋盘分解成包含数百万类似神经元的网络联接,划分为12个不同的网络层。我们让围棋高手训练AlphaGo程序走了3000万步,它预测对手下步棋的准确率达到了57%(之前的纪录是44%)。为了击败而不只是模仿最好的棋手,AlphaGo还能够通过增强学习在神经元之间对弈,调整网络连接,从而开发出新的策略。”

    如果AlphaGo击败李世石,意味着AI赶超人类?

      王安石有云:“莫将戏事扰真情,且可随缘道我赢。战罢两奁分白黑,一枰何处有亏成。”AlphaGo和李世石的对弈肯定不会像王安石这么淡然,但也谈不上绝对的谁胜谁败,只是人工智能的一次进步。是的,无论输赢,AlphaGo都是“胜者”。

      为什么这么说?根据双方制定的规则,即使李世石以3:0或3:1提前取胜,剩下的比赛仍然会继续进行,为的就是让AlphaGo有一次难得的学习机会。谷歌花了100万美元,赚到全球的关注,收获了顶级高手的”技艺“,划得来,胜是意外之喜,败是情理之中,而李世石也很可能拿到巨额奖金,何乐不为?

      说到AlphaGo获胜的意义,也只能代表AI计算能力的胜利,思维博弈方面的胜利还有待商榷。此外,人类大脑的可开发空间还有很大,不像计算那样指数级增长。考虑到人类会受到心理因素、外围环境等影响,AlphaGo在这方面是有着一定优势的。当然,我并不是否认人工智能的巨大进步,这个大黑盒中蕴藏了无限的可能。从长远来看,人工智能的胜利只是时间问题,毕竟人类或许一年玩1000局,而机器一天就能玩100万局,学习的速度相差太多。

      如今,科学技术已经从Google Now、可穿戴设备这种增强人类能力的层级,发展到管理人类生活的层级(无人驾驶汽车),而且有研究表明这种机制的安全性要优于人类的不确定性。未来,人工智能的突飞猛进式发展终有一天会接管人类的大部分工作,在很多领域超越人类。但这一次,我还是赌李世石会赢。

    提示:支持键盘“← →”键翻页
    本文导航

    关注排行榜

    产品品牌

    文章推荐

    互动沙龙

    相关内容 网友评论 返回首页
    专家咨询