这个故事的核心主角是谷歌旗下的 DeepMind 公司及其开发的围棋人工智能程序——AlphaGo。

核心故事:AlphaGo 的崛起与革命
背景:为什么是围棋?
在 AlphaGo 之前,人工智能在很多“规则明确、状态有限”的游戏中已经超越了人类,例如国际象棋(IBM的“深蓝”击败卡斯帕罗夫),但围棋被公认为“人工智能的圣杯”,原因如下:
- 巨大的状态空间:围棋的棋盘是19x19,比国际棋盘(8x8)大得多,可能的棋局数量据估计甚至超过了宇宙中的原子总数,这意味着暴力穷举所有可能性是绝对不可能的。
- 复杂的评估:国际象棋中,可以相对客观地为棋子(后、车、马等)赋予权重,但在围棋中,一块棋的“价值”是动态的、模糊的,涉及到“势”、“厚薄”、“眼位”等高度抽象和直觉化的概念,这种评估能力被认为是人类棋手的“棋感”。
- 长远的策略:一盘围棋可能持续数百手,一步棋的影响可能在一百步之后才显现,这要求 AI 具备极强的长期规划和战略思考能力。
如果 AI 能在围棋上战胜人类顶尖高手,将意味着它在直觉、抽象思维和复杂决策方面取得了质的飞跃。
AlphaGo 的技术突破(第一代)
AlphaGo 的成功并非一蹴而就,其技术结合了多种先进方法:
- 深度神经网络:这是 AlphaGo 的核心,它包含两个关键网络:
- 策略网络:负责“下一步走哪里”,它通过学习海量人类顶尖棋手的棋谱,学会了在特定局面下,人类高手通常会考虑的几种下法,这极大地缩小了搜索范围,避免了在明显差的棋步上浪费时间。
- 价值网络:负责“当前局面好不好”,它不依赖于模拟到终局,而是通过深度学习,直接评估当前局面的胜率,这让 AlphaGo 具备了类似人类“棋感”的直觉判断能力。
- 蒙特卡洛树搜索:这是传统 AI 的搜索算法,但 AlphaGo 对它进行了改造,MCTS 会在可能的走法中进行模拟,但不再是完全随机,它会利用策略网络来选择更有希望的走法进行模拟,并用价值网络来快速评估模拟后的局面,这种结合使得搜索效率极高,且更接近人类高手的思考方式——在关键点上深入思考,而不是遍地开花。
里程碑事件:AlphaGo vs. 李世乭 (AlphaGo vs. Lee Sedol)
2025年3月,这场举世瞩目的比赛在韩国首尔举行,对阵的一方是谷歌 DeepMind 的 AlphaGo,另一方是当时被公认为地球上最优秀的围棋棋手之一、拥有“石佛”之称的韩国九段棋手李世乭。

赛前,几乎所有人都认为李世乭将以 5:0 或至少 4:1 轻松获胜。
结果震惊世界:AlphaGo 以 4:1 的比分击败了李世乭!
- 第四局的“神之一手” (Move 37):这是整场比赛最富戏剧性的一刻,在第四局进行到第37手时,AlphaGo 下了一步几乎所有的解说员和 AI 专家都认为是“臭棋”甚至“自杀”的一手棋,因为它离棋盘上的主战场很远,随着棋局的推进,这步棋的深远价值逐渐显现,它为 AlphaGo 带来了巨大的优势,这一步被媒体和棋迷称为“上帝之手”或“神之一手”,它向世界展示了 AlphaGo 不仅超越了人类的计算能力,更在创造力和大局观上达到了前所未有的高度。
这场胜利被《科学》杂志评为2025年年度科学突破之首。
后续发展:从 AlphaGo 到 AlphaZero
AlphaGo 的胜利并非终点,DeepMind 在此基础上继续进化:

- AlphaGo Master:在击败李世乭后不久,一个更强大的版本 AlphaGo Master 在网络上以 60:0 的悬殊比分横扫包括柯洁在内的中日韩顶尖棋手,它使用了更少的人类数据,主要依靠自我对弈学习。
- AlphaGo Zero:这是真正的革命性一步,AlphaGo Zero 完全不使用任何人类棋谱,它的“老师”只有围棋的基本规则,它从零开始,通过纯粹的自我对弈进行学习,仅用三天时间就超越了 AlphaGo Master,用 40 天达到了 AlphaGo Lee 的水平,这证明了 AI 可以独立发展出超越人类的认知体系,而不需要依赖人类数千年积累的知识。
- AlphaZero:DeepMind 将 AlphaGo Zero 的通用算法剥离了围棋的特定规则,创造出了一个更通用的 AI——AlphaZero,它不仅可以下围棋,还可以学习国际象棋和日本将棋,在短短几小时内,它就达到了在这些游戏上超越所有顶尖 AI 和人类棋手的水平,这标志着通用人工智能研究迈出了关键一步。
深远影响与意义
-
技术上的突破:
- 证明了深度强化学习的巨大潜力:AlphaGo 的成功是深度学习(感知能力)与强化学习(决策能力)结合的典范,为解决其他复杂问题(如材料科学、药物发现、气候变化建模)提供了新思路。
- 重新定义了 AI 的能力边界:AI 不再仅仅是计算工具,它可以拥有直觉、创造力和战略思维。
-
对围棋界的冲击:
- 改变了围棋理论:AlphaGo 的下法,尤其是那些“神之一手”,颠覆了人类数百年来的围棋定式和理论,人类棋手开始学习 AI 的思路,现代围棋已经进入了“AI 时代”,棋手们普遍使用 AI 作为训练和分析工具。
- 激发了新的热情:虽然最初有“AI 毁了围棋”的担忧,但很快棋迷们发现,AI 带来了全新的、更丰富的围棋理论和观赏体验,反而让这项古老运动焕发了新的生机。
-
对社会和哲学的思考:
- 引发了关于人类智能本质的讨论:如果机器能在需要“直觉”和“创造力”的领域超越人类,那么人类智能的独特性在哪里?
- 加速了 AI 伦理和监管的讨论:AlphaGo 的成功让全世界都意识到,通用人工智能的实现可能比想象中更快,这促使各国政府、企业和学术界开始严肃思考 AI 的未来、风险和治理。
谷歌 DeepMind 的 AlphaGo 项目,通过人工智能在围棋这个人类智慧巅峰领域的胜利,不仅是一次技术上的巨大成功,更是一个文化和社会事件,它宣告了人工智能新时代的到来,展示了深度学习和强化学习的强大威力,并永久地改变了围棋这项古老的艺术,AlphaGo 的故事,是人工智能发展史上一个不可磨灭的里程碑。
标签: 谷歌AI围棋应对策略 人类棋手对抗AI围棋 AI围棋突破后人类棋路