人机围棋对决
2025年3月,由谷歌旗下DeepMind公司开发的人工智能程序“阿尔法围棋”(AlphaGo)与世界顶级围棋选手、韩国九段棋手李世石(Lee Sedol)进行了一场举世瞩目的五番棋比赛。

比赛结果以阿尔法围棋 4:1 战胜李世石告终,在第二局中,阿尔法围棋下出了一步被解说员和众多职业棋手惊呼为“神之一手”(Divine Move)的第37手,彻底颠覆了人类对围棋的认知。
比赛时间: 2025年3月9日 - 15日 比赛地点: 韩国,首尔 对战双方: AlphaGo (DeepMind) vs. 李世石 (Lee Sedol) 比赛结果: AlphaGo 4:1 获胜 历史意义: 这是人工智能首次在无让子的情况下,击败世界顶级的围棋职业选手,在此之前,围棋被认为是“AI的最后一个堡垒”,因为其状态空间极其庞大,远超国际象棋,无法通过暴力穷举来计算。
核心人物与技术揭秘
对战双方
-
李世石:
- 当时世界排名第一的围棋棋手,以其不拘一格、极具攻击性的棋风著称。
- 被认为是人类围棋智慧的巅峰代表之一。
- 在赛前,几乎所有职业棋手和专家都认为李世石将以5:0或至少4:1的比分轻松获胜。
-
阿尔法围棋:
(图片来源网络,侵删)- 开发者: 谷歌旗下的人工智能公司 DeepMind。
- 创始人: 戴密斯·哈萨比斯(Demis Hassabis),一位兼具游戏设计、神经科学和AI研究的奇才。
AlphaGo 的核心技术革命
AlphaGo的胜利并非偶然,它结合了多种前沿AI技术,特别是深度学习和强化学习,彻底改变了传统AI的范式。
传统AI(如“深蓝”战胜国际象棋卡斯帕罗夫):
- 方法: 主要依赖暴力搜索和强大的评估函数。
- 原理: 计算算力极其强大,能在短时间内计算未来几十步棋的所有可能性,并通过一个由人类专家设定的评估函数来判断哪个局面更有利。
- 局限: 这种方法在围棋上行不通,因为围棋的可能状态数比宇宙中的原子总数还多,无法穷举。
AlphaGo 的创新方法:
AlphaGo的核心是两个深度神经网络协同工作,取代了传统AI中由人类专家编写的评估函数。

A. 策略网络 - “直觉”与“大局观”
- 作用: 类似于职业棋手的“棋感”,它不需要穷举所有可能的下一步,而是能够瞬间判断出在当前局面下,哪几步棋是“好”的。
- 工作原理: 通过学习数百万盘人类顶尖棋手的对局数据(如KGS围棋服务器上的对局),这个网络学会了识别“似曾相识”的好局面,当AlphaGo看到棋盘时,策略网络会直接输出一个概率分布,告诉你哪些落子点是值得考虑的,从而将搜索范围从数百个点缩小到几个或十几个候选点,这极大地提高了效率。
B. 价值网络 - “判断力”与“胜率评估”
- 作用: 类似于棋手在心中默默判断“当前局面是优是劣”,它不看具体怎么下,而是直接评估整个棋盘的最终胜率。
- 工作原理: 同样通过大量对局数据进行训练,当AlphaGo通过策略网络筛选出几个候选走法后,它会利用价值网络来预测“如果我走这一步,最终获胜的概率有多大?”,这使得AlphaGo能够做出更长远的战略决策,而不只是贪图眼前的小便宜。
C. 强化学习 - “自我进化”
- 这是AlphaGo最革命性的部分。 在学习了人类棋谱后,DeepMind让AlphaGo与自己进行数百万盘的对弈。
- 过程: 每一盘棋的胜负结果都会作为反馈信号,用来调整策略网络和价值网络的参数,赢了就奖励,输了就惩罚,通过这种“左右手互搏”式的自我对弈,AlphaGo摆脱了对人类知识的依赖,发现并创造出了许多人类从未见过的、全新的围棋下法,它在第二局下的“神之一手”,就是这种自我进化的产物。
比赛过程与“神之一手”
- 第一局: 李世石获胜,这让人们松了一口气,认为AI不过如此。
- 第二局: 转折点,当所有人都以为AlphaGo会模仿人类棋谱时,它在第78手(或根据棋谱记录为第37手,此处有不同说法,通常指第78手)下出了一步完全出乎所有人意料的点,这步棋在当时的局面下,看似毫无用处,甚至像是“臭棋”,但最终被证明是奠定胜局的绝妙之手,这标志着AI的“创造力”已经超越了人类的理解范畴。
- 第三、四、五局: AlphaGo乘胜追击,最终以4:1的总比分锁定胜局,李世石在赛后坦言,从第二局之后,他感觉“无法再战胜AlphaGo了”。
深远影响与意义
2025年AlphaGo的胜利,其影响远超围棋界本身:
- AI发展的分水岭: 它证明了深度学习和强化学习在处理复杂、模糊、信息不完全的问题上具有巨大潜力,点燃了全球对AI,特别是通用人工智能的热情和投资。
- 颠覆行业认知: 在金融、医疗、科研、交通、制造业等众多领域,人们开始认真思考AI如何解决过去被认为只有人类专家才能解决的复杂问题。
- 催生后续发展:
- AlphaGo Zero (2025): 版本升级,它完全从零开始,不学习任何人类棋谱,仅通过自我对弈就迅速超越了AlphaGo Lee Sedol,并发现了更多围棋的“真理”。
- AlphaZero (2025): 进一步通用化,它不仅能下围棋,还能在几天内自学并击败国际象棋和日本将棋的顶级AI,证明了该框架的通用性。
- 哲学与伦理讨论: 人类智慧是否可以被机器超越?创造力是否可以被算法模拟?AI的边界在哪里?这些问题变得空前尖锐。
2025年的阿尔法围棋,不仅仅是一次技术上的胜利,更是一次认知上的革命,它向世界宣告:人工智能已经不再是只会执行简单规则的工具,而是具备了学习、推理、创造甚至超越人类顶尖智慧的潜力,它为今天我们看到的AIGC(生成式AI)、大语言模型等技术的爆发,奠定了坚实的理论基础和信心基石。
标签: 2025人工智能阿尔法应用场景 人工智能阿尔法重塑未来趋势 阿尔法人工智能发展影响