共计 706 个字符,预计需要花费 2 分钟才能阅读完成。
2025 年 10 月 4 日,北京—— 今天,火山引擎宣布推出豆包大模型 1.6-vision,这一发布标志着多模态人工智能技术的重大进展。作为豆包大模型系列中首个具备工具调用功能的视觉深度思考模型,1.6-vision 在通用的多模态理解与推理能力上取得了显著提升,同时通过创新的功能设计和性能优化,极大地提升了开发者的效率和性价比。
豆包大模型 1.6-vision 的一个核心特色是其突破性的“工具调用”功能。该模型能够将图像深度整合进其思维链(Chain-of-Thought),模拟人类“从全局视角到局部细节”的视觉推理过程。这使得模型不仅可以理解图像内容,还能执行如定位、剪裁、选择、绘制、缩放和旋转等一系列精细的图像操作指令,显著拓宽了 AI 在视觉任务中的应用范围。
此外,新的模型全面支持 Responses API,为开发者提供更加灵活且高效的集成选项。通过这些技术创新,豆包大模型 1.6-vision 在确保强大功能的同时,极大地降低了综合使用成本,提升了开发效率和商业应用的性价比。
此次发布展示了字节跳动和火山引擎在 AI 大模型领域不断创新的实力。豆包大模型 1.6-vision 的推出,将为内容创作、智能客服、电商、教育、工业检测等多个行业提供全新的智能解决方案,助力企业加速 AI 应用的落地,实现多模态人机交互的新篇章。