AI编程崛起：OpenAI与DeepMind模型助力夺得国际大学生编程大赛金牌！

共计 1402 个字符，预计需要花费 4 分钟才能阅读完成。

人工智能在国际大学生程序设计竞赛中取得辉煌成就

本月初，在阿塞拜疆举行的国际大学生程序设计竞赛世界总决赛上，OpenAI与谷歌DeepMind的人工智能系统取得了金牌级别的辉煌成绩，成功解决了人类选手无法应对的难题。DeepMind将这一时刻称之为“向通用人工智能（AGI）迈进的重要里程碑”。

此次ICPC总决赛吸引了来自103个国家、近3000所高等院校的139支顶尖队伍参赛。在12道题目中，OpenAI表现出色，全部解决了所有题目，而Gemini 2.5 Deep Think模型则以金牌水平解决了10道题目，位居第二。

OpenAI的参赛团队由多个通用模型构成，包括GPT-5和一个实验性的推理模型。GPT-5成功解决了11道题，而实验性推理模型则攻克了最难的第12道题，并负责最终提交结果。值得一提的是，这些模型并没有经过专门针对ICPC的训练。OpenAI的技术团队在赛后表示：“我清楚地记得我加入OpenAI时，我们的最佳AI模型甚至无法解决Codeforces的简单问题。看到过去两年所取得的进步，真让人难以置信。”

谷歌方面则指出，Gemini 2.5并非为ICPC量身定制，而是用户在Gemini应用中可直接使用的版本。该模型在比赛开始后10分钟启动，前45分钟内便解决了8道题目，三小时内又完成了另外两道。DeepMind表示，这一成绩代表了人工智能在“解决抽象问题能力上的重大飞跃”。例如，Gemini在不到半小时内解决了“问题C”——一个关于管道网络向储液器分配液体的复杂优化问题，而这一题目无人类队伍成功解答。

DeepMind副总裁Quoc Le进一步解释道：“对我而言，这一时刻犹如国际象棋的‘深蓝’与围棋的AlphaGo之间的较量。”他强调，这一进展不仅限于棋类游戏的受限环境，更接近现实世界，因此可能对多个科学与工程领域产生深远影响，比如新药或芯片的设计。

谷歌表示，Gemini 2.5 Deep Think是一款经过专门训练的通用人工智能模型，能够处理极为复杂的编码、数学和推理问题，其表现达到了“全球前20名程序员的水平”。在这些竞赛中，成功完成复杂任务需要深刻的抽象推理能力、创造力以及整合新解决方案的能力。

许多网友在社交媒体上庆祝这一历史性时刻，人工智能在ICPC上获得金牌可能意味着它将成为程序员真正的合作伙伴。然而，这也引发了关于人类编程能力是否会永远落后于AI的担忧。

加州大学伯克利分校的计算机科学教授斯图尔特·拉塞尔在细节公布前表示：“这一划时代的说法似乎有些夸大其辞。”他认为，人工智能在编程任务上的出色表现已经持续一段时间，而“人工智能公司在声称取得突破时面临着巨大的压力。”

尽管如此，他也承认：“要正确回答ICPC的问题，代码必须能够正常运行（至少在有限的测试用例上），因此这一表现可能表明，人工智能编码系统在生成高质量代码的准确性上取得了进展。”

实习生赵蕊澎湃新闻记者贾利略

(本文来自澎湃新闻，更多原创资讯请下载“澎湃新闻”APP)

来源：今日头条

原文标题：AI编程真的厉害，OpenAI、DeepMind模型夺得国际大学生程序设计决赛金牌 – 今日头条

原文链接：https://www.toutiao.com/article/7551310031745057290/

声明：

文章来自网络收集后经过ai改写发布，如不小心侵犯了您的权益，请联系本站删除，给您带来困扰，深表歉意！

正文完

DeepMind OpenAI 人工智能大学生比赛编程

发表至： AI大模型

2026-01-10

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

使用智语AI写作智能工具，您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章，还是创作引人入胜的故事，AI助手都能为您提供丰富的素材和创意，激发您的写作灵感。您只需输入几个关键词或主题，AI便会迅速为您生成相关内容，让您在短时间内完成写作任务。
利用AI智能写作工具，轻松生成高质量内容。无论是文章、博客还是创意写作，我们的免费 AI 助手都能帮助你提升写作效率，激发灵感。来智语AI体验 ChatGPT中文版，开启你的智能写作之旅！

掌握Llama3-400B大模型的关键，助力AI应用快速升级

你知道边缘大模型是什么吗？- 深入了解AI大模型的实际应用与技术解析

探索AI金融大模型概念与龙头股票，揭示其市场潜力与未来趋势

这个ai大模型视频课程，可能改变你对未来的看法！

AI绘图时代：谁才是创作的真正掌控者？

探索智语AI为何火爆：从科大讯飞到国产大模型的未来趋势

2024年国内AI大模型排行榜：从技术创新到应用落地的全面解析与展望

探索2024年国内AI大模型市场：最新产品、免费资源与行业前景全解析！

深入探讨 Anthropic Claude Opus 4.5 的技术亮点与评估价值

苹果开发者揭秘：借助Claude实现95%开发，应用已成功上架！