共计 1402 个字符,预计需要花费 4 分钟才能阅读完成。
本月初,在阿塞拜疆举行的国际大学生程序设计竞赛世界总决赛上,OpenAI与谷歌DeepMind的人工智能系统取得了金牌级别的辉煌成绩,成功解决了人类选手无法应对的难题。DeepMind将这一时刻称之为“向通用人工智能(AGI)迈进的重要里程碑”。
此次ICPC总决赛吸引了来自103个国家、近3000所高等院校的139支顶尖队伍参赛。在12道题目中,OpenAI表现出色,全部解决了所有题目,而Gemini 2.5 Deep Think模型则以金牌水平解决了10道题目,位居第二。
OpenAI的参赛团队由多个通用模型构成,包括GPT-5和一个实验性的推理模型。GPT-5成功解决了11道题,而实验性推理模型则攻克了最难的第12道题,并负责最终提交结果。值得一提的是,这些模型并没有经过专门针对ICPC的训练。OpenAI的技术团队在赛后表示:“我清楚地记得我加入OpenAI时,我们的最佳AI模型甚至无法解决Codeforces的简单问题。看到过去两年所取得的进步,真让人难以置信。”
谷歌方面则指出,Gemini 2.5并非为ICPC量身定制,而是用户在Gemini应用中可直接使用的版本。该模型在比赛开始后10分钟启动,前45分钟内便解决了8道题目,三小时内又完成了另外两道。DeepMind表示,这一成绩代表了人工智能在“解决抽象问题能力上的重大飞跃”。例如,Gemini在不到半小时内解决了“问题C”——一个关于管道网络向储液器分配液体的复杂优化问题,而这一题目无人类队伍成功解答。
DeepMind副总裁Quoc Le进一步解释道:“对我而言,这一时刻犹如国际象棋的‘深蓝’与围棋的AlphaGo之间的较量。”他强调,这一进展不仅限于棋类游戏的受限环境,更接近现实世界,因此可能对多个科学与工程领域产生深远影响,比如新药或芯片的设计。
谷歌表示,Gemini 2.5 Deep Think是一款经过专门训练的通用人工智能模型,能够处理极为复杂的编码、数学和推理问题,其表现达到了“全球前20名程序员的水平”。在这些竞赛中,成功完成复杂任务需要深刻的抽象推理能力、创造力以及整合新解决方案的能力。
许多网友在社交媒体上庆祝这一历史性时刻,人工智能在ICPC上获得金牌可能意味着它将成为程序员真正的合作伙伴。然而,这也引发了关于人类编程能力是否会永远落后于AI的担忧。
加州大学伯克利分校的计算机科学教授斯图尔特·拉塞尔在细节公布前表示:“这一划时代的说法似乎有些夸大其辞。”他认为,人工智能在编程任务上的出色表现已经持续一段时间,而“人工智能公司在声称取得突破时面临着巨大的压力。”
尽管如此,他也承认:“要正确回答ICPC的问题,代码必须能够正常运行(至少在有限的测试用例上),因此这一表现可能表明,人工智能编码系统在生成高质量代码的准确性上取得了进展。”
实习生 赵蕊 澎湃新闻记者 贾利略
(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)


AI在编程大赛中取得的成就让我感到振奋,未来的编程学习将更加依赖这些智能模型,期待看到更多的应用和创新。