AGI狂潮来袭,Claude年终称王!自主编程时长近5小时引发全网热议!

共计 2422 个字符,预计需要花费 7 分钟才能阅读完成。

初次看到 METR 所描绘的“AI 任务时长增长曲线”,我并未感到特别惊讶。尽管曲线看上去美观,数据也颇为引人注目,但当我们站在 2025 年的时间节点回望,发现这几年间确实出现了一些异常。

你还记得两年前的情景吗?当时大家都在调侃 AI 的无能,认为 GPT 只能写一些简单的内容,遇到复杂的任务,如代码迭代或多人协作流程时,最多坚持一小时。然而,到 2025 年时,出乎意料的是一位“民间高手”崭露头角,正是老牌公司 Anthropic 推出的 Claude Opus 4.5,竟然可以连续编码 4.5 小时而不掉线,甚至把 OpenAI 的 GPT-5.1-Codex-Max 按在地上摩擦。曾经是谷歌与 OpenAI 的双雄对决,现在却演变成了三家公司的混战局面。

这组数据真是无法让人忽视。METR 的报告清晰地指出,从 2019 年到 2024 年,每隔 7 个月,任务所需的时间便翻倍。而到了 2024 年到 2025 年,这一时间间隔缩短至 4 个月。这种增长速度可谓骇人听闻,简直比比特币的暴涨还要惊人。就像一群程序员熬夜编写代码,刚喝完一杯咖啡,AI 却已经迅速完成了下一轮的升级。

有人称这张图为“AI 发展过程中最重要的图表之一”。在我看来,它揭示了一个本被忽视的问题:AI 是否真的遇到了发展的天花板?其进步是否只是一种假象?很多普通用户在日常使用模型时,觉得产品已经足够智能,难以理解科技界为何仍在高喊“革命尚未到来”。

实际上,最显著的变化发生在编码智能体的领域。许多人默默地将模型操作得如同小型工厂,不仅可以定制自动化软件,还能进行数据库的自动维护,甚至进行周期性的策略推演——这些不再是简单的工具,而是能够持续数小时而不崩溃的“数字工作伙伴”。如果询问政策制定者,他们似乎并没有太多关注,媒体也只是跟风报道科幻剧。但企业的首席技术官们已经开始摩拳擦掌,准备削减一半的人力。

展望未来,到 2026 年春季,智能体据说能够独立承担一天的工作负荷;再过半年,甚至能够处理半周的工作量;到 2028 年,某些团队可能完全依靠 AI 进行运作。这让我想起上世纪自动化流水线普及初期时的情景,“产业工人还能继续工作几十年吗?”如今在智能体时代,这个问题再次浮现。

目前,行业的新趋势是“50% 任务完成时间跨度”。简单来说,就是给 AI 一项任务,看看它的成功率至少达到 50%,而且能够维持较长时间。GPT-5.1-Codex-Max“持续了近 3 小时”,而 Opus 4.5 则直接达到了将近 5 小时,表现得极为出色。但有趣的是,在达到 80% 任务完成率时,Opus 4.5 仅剩 27 分钟的时间,显示出两者之间的差距明显。这种现象有些像考试中的偏科生,越难的题目反而表现得更稳定。

AI 记忆系统的未来:AGI 的成长与人类的挑战

更为引人注目的是,关于“Claude Code 是否已经具备 AGI”的讨论频频出现。这种赞美似乎是必然的。然而,到了 2025 年,科技界的争议依旧如火如荼。每当新的技术突破浮现,社交媒体便陷入了激烈的辩论之中,诸如“AGI 是否为乌托邦”或“AI 是否仅为闹剧”的话题始终难以平息。实际上,技术的进步往往藏于细节之中,表面上的舆论与真实的进展之间存在着显著的不同步。

提到这一点,令人关注的是模型的记忆机制。AI 在处理任务的持续时间越长,其“记忆缺陷”愈加显著。现今的许多模型,仿佛是过度劳累的员工:虽然能顺利完成任务,但一旦休息,之前的工作便全然无记。“能够编写代码、进行推理和分析”,可下班瞬间却失忆。即便引入外部工具、上下文扩展以及高级的 RAG 检索,系统的准确率也最多提升至 90%。这项工作主要依赖“主动记忆”,无法像人类那样“越用越聪明”。

所谓“记忆难题”并非轻描淡写之事。是否能够像人脑那样,将短期经历转化为长期知识,并在每次失败中深刻铭记,以便下次能够避开同样的错误?目前尚无模型能够做到这一点。OpenAI 在后续更新中,其他模型也在努力跟进。短期内,大家只能接受“短暂的停顿以换取记忆力的提升”,而长远来看,则需依赖更深层的架构升级,确保模型能真正实现主动学习。

未来一年,谁能在记忆与学习的突破上抢得先机,将会成为焦点。这些看似微小的细节却不可小觑,毕竟率先让模型实现自我领悟与自我反思的团队,将有效推动 AGI 迈向新的阶段。目前,Cursor、Replit 以及 Lovable 等平台正在探索 AI 管理代码库的模式,用户无需再手动点击文件树,智能体将处理一切事务。美国的研究团队也在探索“注意力机制之外的新一代记忆架构”,预计明年春天将有重大进展。

AGI 的未来将会如何?目前没有定论。过去一年,模型发展的速度被严重低估,几次技术飞跃甚至引发了组织结构的调整。看看那些小型团队,几个人的产能竟可与过去几十人相媲美。如果记忆再取得突破性进展,不用多说,智能体将从“死工具”转变为数字化同事,甚至可能成为小企业的核心管理者。

想象一下,AGI 能够记住你的饮食偏好,了解你曾经的失误,并能从项目经验中吸取教训,主动帮助你规避错误。归根结底,这才是 AGI 应有的形态。我们不禁要思考,当它真正掌握“记忆”与“自我成长”的能力时,人类将何去何从,下一步该如何定位自身呢?

这真是一个复杂的问题。

标题:AGI 的未来:记忆与自我成长的双重挑战

我们应当铭记自己的饮食习惯,反思过去的错误,并从以往的项目经验中汲取教训,以此主动避免重蹈覆辙。这种能力正是 AGI 所应具备的核心特征。然而,当我们思考 AGI 真正掌握“记忆”及“自我成长”能力之际,人类又将面临怎样的未来呢?在这种情况下,我们的定位又该如何调整?这无疑是一个值得深思的复杂议题。

来源:今日头条
原文标题: 狂奔 AGI,Claude 年终封王!自主编码近 5 小时震惊全网 – 今日头条
声明:
文章来自网络收集后经过 ai 改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2026-01-09发表,共计2422字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
评论(没有评论)
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!
0