低成本AI普惠:豆包视觉模型的创新之路

共计 1812 个字符,预计需要花费 5 分钟才能阅读完成。

在12月18日,上海世博中心,火山引擎 Force 大会如火如荼地展开,现场近4000人的目光被一段广告视频牢牢吸引。

一位观众举起手机,指向一个白色球形设备,询问豆包:“你知道这是什么吗?”豆包回应:“这是一款创意加湿器,外形酷似太空舱,顶部有喷雾孔。”接着,他又将手机对准一页杂志,问道:“这是什么图?”豆包答道:“这是猎户座中M78星云的星云图。”

通过手机摄像头随意扫描,豆包能够解析体检报告、修改代码错误、解读简笔画,并帮助找到高铁检票口,仿佛是一个无所不知的智能助手。

广告片的背后展示了豆包模型的视觉识别能力,这一新功能于12月18号由字节跳动重磅推出。与语言模型相比,视觉模型提供了更为丰富的互动方式,能够显著拓展应用场景。

图:火山引擎总裁谭待

当日,豆包进一步展示了其技术创新带来的成本优化,使视觉模型的价格比行业标准低了85%。火山引擎总裁谭待指出,尽管豆包大模型发布较晚,但其迭代速度极快,现已成为国内技术领先、功能全面的大模型之一。

视觉模型迈入“厘”时代

在大会现场,谭待展示的一份PPT让人回忆起了5月的盛况。

在5月份,谭待曾展示一张PPT,宣布豆包的语言模型价格已降至行业平均水平的99.3%,成功将其推入“厘”时代,随后引发了国内大模型降价潮。

这一次,虽然场地不同,但发布的动作类似,豆包视觉理解模型的定价为每千tokens输入仅需3厘,仅用1元就能处理284张720P的图片,价格较行业标准低85%。

豆包语言模型在降价后,使用量迅速增长,截止到12月中旬,日均tokens使用量已超过4万亿,较5月首次发布时增长了整整33倍。此次,豆包视觉模型也有望延续语言模型的成功。

谭待表示:“让每个企业都能负担得起”是视觉理解模型的定价原则,致力于以合理、可持续的价格,帮助企业和开发者大胆进行多模态创新。

研究表明,人类获取的信息超过80%是通过视觉。视觉理解将大幅拓展大模型的能力边界,降低用户与大模型间的交互门槛,为模型开启更多应用场景。

然而,之前视觉模型的高昂价格一直是限制AI应用普及的一大障碍。对于创业者和用户而言,门槛相对较高。

随着豆包视觉模型的降价,有望推动AI视觉应用的普及。谭待指出,此次推出视觉模型的目标是一次性到位,正如当初推出语言模型时那样,让大家能够使用,利用反馈与创新进行进一步发展,这一过程至关重要。

促进AI技术普及与应用爆发

视觉理解模型可以实现“看图说话”,识别图像中的物体类别、形状等要素,分析物体之间的关系,得出空间和场景的总体判断。相较于语言模型,视觉模型将带来更广泛的AI应用场景。

在正式发布视觉模型之前,豆包已经邀请数百家企业进行为期两个月的内测,并在多种场合下应用该模型。

根据测试反馈,在教育、电商及图片问答领域,豆包视觉模型表现出了显著的突破。在教育场景中,家长将手机对准孩子的英语作文,豆包能够自动批改并标注错误,进行评分。在电商领域,用户发送图片给豆包,豆包可以快速找到同款商品并提供推荐价格。而在图片问答方面,游客拍摄建筑,豆包则能迅速告知其位于哪个城市及相关历史故事。

除了上述三个领域,金融、医疗、建筑、物流及体育等行业,视觉模型同样能够发挥更大的作用。

据了解,豆包视觉理解模型具备精准的视觉内容识别能力,同时还拥有出色的理解和推理能力,能够根据图像信息进行复杂的逻辑运算,完成图表分析、代码处理及学科问题解答等任务。此外,该模型在视觉描述和创作方面也表现出色。

目前,豆包的视觉理解模型已接入豆包App和PC端产品。豆包战略研究负责人周昊表示:“豆包一直在努力提升用户输入的速度和便利性。”为此,豆包的产品在多模态输入和功能打磨上非常注重,包括语音、视觉等能力,这些模型均已通过火山引擎向企业客户开放。

在大会上,豆包的3D生成模型首次亮相。该模型与火山引擎的数字孪生平台veOmniverse结合,能够高效完成智能训练、数据合成及数字资产制作,成为一套支持AIGC创作的物理世界仿真模拟器。

谭待强调:“今年是大模型快速发展的关键一年。当你看到一列高速行驶的列车,最重要的事情就是确保自己能顺利上车。通过AI云原生和豆包大模型家族,火山引擎希望助力企业实现AI创新,驶向更加美好的未来。”

来源:今日头条
原文标题: 豆包视觉模型:以更低成本推动 AI 技术普惠 – 今日头条
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-10-03发表,共计1812字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!