共计 1372 个字符,预计需要花费 4 分钟才能阅读完成。
本月初,阿塞拜疆举办的国际大学生程序设计竞赛(ICPC)世界决赛上,OpenAI与谷歌DeepMind的人工智能系统分别取得了金牌级别的优异成绩,成功解决了人类参赛者无法解答的问题。DeepMind对此表示,这是朝向通用人工智能(AGI)迈进的重要里程碑。
本届ICPC总决赛吸引了来自103个国家、近3000所大学的139支顶尖队伍参与。在12道题目中,OpenAI的表现尤为突出,成功解答了所有题目,而Gemini 2.5 Deep Think模型则解决了10道题,获得第二名的金牌成绩。
OpenAI的参赛系统由多种通用模型构成,包括GPT-5和一个实验性推理模型。值得一提的是,GPT-5解决了11道题,而实验性推理模型则解出了最具挑战性的第12道题,并负责最终的提交决策。所有这些模型均未经过专门训练以应对ICPC。赛后,OpenAI的技术团队感慨道:“我记得刚加入时,我们的AI模型甚至无法解答Codeforces上的简单问题。如今两年的快速进步,实在令人难以置信。”
谷歌介绍,Gemini 2.5并非专为ICPC量身定制,而是用户可在Gemini应用中直接使用的版本。该模型在比赛开始后10分钟启动,前45分钟便完成了8道题,三小时内又解决了两道。DeepMind认为,这一表现标志着人工智能在解决抽象问题能力上的巨大飞跃。例如,Gemini在不到半小时内成功解答了关于管道网络向储液器分配液体的复杂优化问题,而这一题目无人类队伍能够成功解答。
DeepMind副总裁Quoc Le表示:“这一时刻可以比作国际象棋的‘深蓝’和围棋的AlphaGo的历史性突破。”他进一步指出,这一进展更贴近现实世界,而不仅局限于国际象棋和围棋等有限环境,因而可能对许多科学和工程领域带来改变,例如新药或芯片的设计。
谷歌强调,Gemini 2.5 Deep Think是一款经过专门训练的通用人工智能模型,具备解决复杂编码、数学和推理问题的能力,其表现可与全球前20名程序员相媲美。解决这些竞赛中的复杂任务,需要深度的抽象推理、创造力以及综合新方案的能力,展现出真正的创造力火花。
许多网友在社交媒体上共同庆祝这一历史性时刻。人工智能在ICPC赢得金牌,可能预示着AI将成为程序员真正的合作伙伴,但也引发了人们对未来人类编程能力可能永远落后于AI的担忧。
加州大学伯克利分校的计算机科学教授斯图尔特·拉塞尔在比赛结果公布前表示,“这一说法似乎有些夸张。”他认为,人工智能在编程任务上的优异表现已有一段时间,而“人工智能公司面临着巨大的压力来声称自己取得了突破。”
不过,他也承认,要正确解答ICPC的问题,代码必须在有限的测试用例中正常运行,这或许表明人工智能在生成高质量代码的准确性方面有所进步。
实习生 赵蕊 澎湃新闻记者 贾利略
(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)
