共计 1407 个字符,预计需要花费 4 分钟才能阅读完成。
字节跳动的编程模型终于如大家所期待的那样发布了,令人振奋不已!
最近,Doubao-Seed-Code 正式亮相,这款模型专为 Agentic Coding 任务而优化,具备了以下几个显著特点:
- 1、支持多种模态
- 2、上下文长度达到 256K,使用成本降低了 62.7%
- 3、性能仅次于 Sonnet 4.5
- 4、与 Trae 的结合,使其在 SWE-Bench Verified 榜单上名列前茅
- 5、兼容 Anthropic API,并支持其他主流开发环境
- 6、推出了专门的编码计划
总的来说,这款模型的性能与 Sonnet 4.5 相当,但其使用成本却降至行业最低,工程师们无疑会对此感到欣喜。
字节跳动的编码模型现已正式加入市场,势头强劲。
#01 编码领域的竞争愈演愈烈
OpenAI 和 Anthropic 早已将编码视为竞争的重心,无论是产品还是模型的开发都体现了这一点。
与此同时,这一趋势在国内也迅速扩展。粗略估算,智谱、Kimi、MiniMax、腾讯、阿里、快手、美团、京东等多家创业公司及顶尖科技企业,都将编码模型视为其人工智能战略的核心部分。
字节跳动的 Trae 已成为国内最受欢迎的 AI IDE,但此前他们一直依赖于第三方模型的能力。因此,大家早已预见字节会推出独立的编程模型。
按照字节过往的策略,显然不会匆忙推出一款普通的模型。
今年,DeepSeek R1 备受关注时,许多公司的 ChatBot 开始应用 R1,但豆包却选择静观其变。最终,字节果然推出了最新的推理模型,超出了大家的预期。
这次的 Doubao-Seed-Code 同样表现出色,一出场便超越了众多国内外的编码模型。
而且,字节不仅仅局限于模型的研发,众所周知,Trae 在国内外市场的占有率也相当可观。虽然没有具体的统计数据,但根据个人经验,Trae 应该是国内用户最多的 AI IDE,身边使用的人相当多。
AI IDE 的竞争绝不仅仅是模型的比拼,否则 Cursor 早就没有立足之地了。
我认为,明年的 AI IDE 竞争将从单一的模型能力向模型与产品的综合实力转变。
此次测评也清楚显示,Doubao-Seed-Code 与 Trae 的配合让其在 SWE-Bench Verified 榜单中荣登第一,展现了产品与模型相互协作的价值。
#02 案例评测
我准备了几个真实的案例进行测试,因为我注意到官方特别强调这款模型是为复杂的编程任务设计的。
大家对 Demo 的期待已久。
最近,我们的 AI Maker Summit 大会的网址一直采用 Vibe Coding,虽然这个场景并不复杂,但却是测试模型能力的绝佳机会。
毕竟这是一个真实场景,我们有明确的任务目标和审美标准。
以下是目前讲师页面的截图:
今天,我们的需求是在讲师个人简介下方添加议题介绍部分。
经过测试多个模型后,我发现,在类似场景中,迅速实现符合要求的设计并非易事。早晨时,我认为 GPT-5-Codex 的效果最佳。
现在,让我们看看豆包的编码模型表现如何。
我使用的 IDE 是 Claude Code。由于 Doubao-Seed-Code 的 API 兼容 Anthropic,我们也可以 …

