2016年3月,Goolge旗下DeepMind公司开发的AlphaGo围棋程序与围棋世界冠军、职业九段棋手李世石进行
A、AlphaGo不需要人类任何先验知识,能够自主学习。
B、AlphaGo是大数据、大计算、大决策,三位一体,象征着计算机技术已进入人工智能的新信息技术时代。
C、AlphaGo的第一个神经网络大脑是“监督学习的策略网络(Policy Network)” ,观察棋盘布局企图找到最佳的下一步。事实上,它预测每一个合法下一步的最佳概率,那么最前面猜测的就是那个概率最高的。这可以理解成“落子选择器”。
D、AlphaGo的第二个大脑是棋局评估器 (Position Evaluator),它是根据当前给定棋子位置情况下,预测每一个棋手赢棋的可能。通过整体局面判断来辅助落子选择器。通过分类潜在的未来局面的“好”与“坏”,AlphaGo能够决定是否通过特殊变种去深入阅读。如果局面评估器说这个特殊变种不行,那么AI就跳过阅读在这一条线上的任何更多落子。这个判断仅仅是大概的,但对于阅读速度提高很有帮助。