共计 2936 个字符,预计需要花费 8 分钟才能阅读完成。
文章
国内的视频生成技术取得了重要进展。
6月11日,火山引擎在Force原动力大会上重磅发布了豆包大模型1.6和视频生成模型Seedance 1.0 Pro等关键技术,同时推出了AI云原生系列产品。
火山引擎在2024年推出豆包大模型,引发了国内外AI大模型降价潮。如今,火山引擎总裁谭待再次强调了性价比的重要性。
谭待在现场介绍,豆包视觉大模型Seedance 1.0 pro的费用为每千tokens仅0.015元,生成一条5秒的1080P视频仅需3.67元,成为行业中最低的价格。这一成本意味着,理论上,1万元的预算能够生成2725条5秒的1080P视频。此外,豆包1.6首次推出按“输入长度”区间定价的模式,深度思考、多模态能力与基础语言模型统一定价,综合成本仅为豆包1.5深度思考模型或DeepSeek R1的三分之一,显著降低了企业的使用成本。
目前,国内外多个大模型已经覆盖了文字、图像、视频、语音、音乐等内容生成领域。在国际上,以OpenAI和Google为代表的巨头不断进行优化;而在国内,生成式大模型在多模态应用上也实现了局部领先,DeepSeek和豆包大模型持续提升。在AI技术从Agent向Agentic时代的转变中,国产大模型应当向何方努力呢?
性价比策略的推动力
自今年2月中国DeepSeek的问世以来,国内外的AI大模型企业都感到压力。
在2024年5月,字节跳动在豆包大模型发布会上宣布将企业级产品的价格定为0.0008元/千Tokens,相当于1元约可购买200万个汉字,低于行业价格99.3%,掀起了AI降价潮。随之而来,阿里和百度等公司也纷纷跟进降价策略。OpenAI的首席执行官Sam Altman也宣布,免费版ChatGPT将在标准智能设置下无限制使用GPT-5。
此外,凭借文生视频大模型Sora,OpenAI的ChatGPT会员月费曾从2023年2月的19.99美元上涨至2024年12月的200美元,涨幅近10倍,成为全球最高的使用费用。印度的创业者在与OpenAI高层会晤时,也曾呼吁降低AI模型的价格以促进普及。
而在中国大模型快速发展的背景下,曾经引领AI大模型定价的OpenAI也选择了降价和免费策略。
时代周报记者制
在6月11日的视频生成领域,豆包视频生成模型再次迎来突破。
现在,豆包大模型已涵盖多模态、视频、图像、语音、音乐等多个模型类别。其中,豆包视频生成模型Seedance 1.0 pro支持文字与图像输入,能够生成多镜头视频,每生成一条5秒的1080P视频仅需3.67元,成为行业最低。
在国际知名评测平台Artificial Analysis上,Seedance在文生视频和图生视频两项任务中均排名第一,超越了Veo3和可灵2.0等优秀模型。
即梦和豆包均已搭载Seedance。6月12日,时代周报记者使用豆包发现,在推拉摇移远近特写等镜头表现上,Seedance 1.0 pro表现出色。从生产效率来看,以图生视频为例,输入“推镜头转特写”的文字指令后,豆包大约等待1~3分钟即可生成,且特写画面的清晰度较高。而同样使用一张照片和相同指令时,可灵则需排队超过3小时才能见到效果。
左为豆包,右为可灵
在应用层面,越来越高质量的AI生成视频正在根本改变内容生产的逻辑与模式。在电商领域,无缝多镜头、多动作多主体的互动能力使得产品展示更加丰富。在影视行业,新模型的能力能够帮助从业者快速验证分镜与叙事逻辑,从而减少前期准备的成本。
火山引擎总裁谭待在接受媒体采访时透露,此次价格策略并非单纯的降价,而是基于技术底层的进步进行的价值重构,旨在推动行业的应用发展。
“技术在不断进步,定能持续优化成本。我们的宗旨是每当达到一定阶段,便尽可能释放技术红利,让所有开发者和企业都能受益,加速AI的应用发展。”谭待表示,去年豆包大模型将AI使用价格降低了99%,许多公司也随之采用这一策略,助力中国的大模型快速发展。目前,豆包大模型已为全球十大手机厂商中的9家、80%的主流汽车品牌、70%的系统重要性银行以及超50%的985高校提供服务。
国际数据公司(IDC)在今年四月发布的《中国公有云大模型服务市场格局分析》报告中指出,2024年将成为中国公有云大模型市场的“爆发元年”。数据表明,上半年日均调用量仅为963亿Tokens,但到12月已经激增至9522亿Tokens,半年内增长接近10倍。IDC将这一爆发性增长归因于技术、场景和政策三大驱动因素的共同作用。多家云厂商通过算法优化和硬件升级,将大模型推理成本降低到“厘时代”。
国产大模型能否突围?
IDC数据显示,2024年中国生成式AI基础设施的规模已达到356亿元人民币,其中公有云大模型的调用量达114.2万亿Tokens(不包括出海群体使用的MaaS平台的调用量及各大模型APP上的调用量),同比增长近10倍。火山引擎以46.4%的市场份额居于领先地位,百度智能云和阿里云紧随其后,分别占据19.3%的份额,腾讯云、中国移动、天翼云等公有云厂商共同占据15%的市场份额,形成“一超多强”的竞争格局。
在国内竞争的同时,也需要关注海外市场。
在AI大模型的竞争日益激烈后,业内人士曾因国产大模型与ChatGPT之间的差距而展开热烈的讨论,普遍认为ChatGPT的先发优势会导致国内外大模型效果差距进一步扩大。
然而,进入2025年后,英伟达的首席执行官黄仁勋在5月发布的2026财年第一季度报告电话会议上表示,中国的人工智能竞争对手正在填补美国公司留下的空白,技术日益强大,中美之间的人工智能产品差距正在不断缩小。他多次强调,中国是全球最大的人工智能市场之一,全球一半的人工智能研究人员在中国,并认为赢得中国市场的平台将引领全球。
在火山引擎大会上,谭待透露,豆包大模型的能力已跻身全球行业前列。在GPQA Diamond、AIME25、MultiChallenge的评测中,豆包1.6版本均表现优异,在复杂推理、竞赛级数学、多轮对话和指令遵循等能力上,进入全球第一梯队。
此外,Agent作为个人或企业实现AI在现实世界应用的关键工具,火山引擎的AI云原生再次进行了全栈升级,以更好地支持Agent的开发与应用。
谭待对Agent的市场前景充满信心,表示大模型正在快速进化,从感知AI到生成式AI,再到Agentic AI。他希望大模型不仅仅完成信息的识别、处理和生成,而是能够自主推理、规划行动并执行任务,成为构建复杂业务闭环的智能体。
“如果2024年是中国大模型应用的元年,那么2025年将很可能是中国Agent落地的元年,Agent将逐步融入企业的各个业务流程。”谭待表示,在这一阶段,深度思考、多模态理解和工具自主调用将是模型进化的关键方向。
实际上,站在2025年的节点上,中国大模型已经不再满足于“性价比之王”的标签,在激烈的技术竞争中,持续拓展应用边界,推动AI进入更广阔市场才是未来的发展方向。