智源评测：多模态图文理解赛场上腾讯混元勇夺国内冠军！

共计 1204 个字符，预计需要花费 4 分钟才能阅读完成。

自2024年开始，大型模型评测领域迎来了新的变革。为了杜绝“刷榜”现象，评测机构推出了“角斗场”（Arena）模式，采用随机抽取模型进行对抗的方式。这种方式向用户开放，通过直接提问和评分的方式对模型进行排名，从而有效评估其在实际应用中的表现。

图：智源FlagEval大模型角斗场多模态模型测评界面

根据最近发布的FlagEval大模型角斗场榜单，腾讯的混元多模态图文理解大模型凭借卓越的表现，荣登国内大模型第一的位置，并与GPT4o及claude等其他模型共同跻身第一梯队。

智源研究院发布的FlagEval大模型角斗场榜单

FlagEval角斗场由北京智源研究院推出，接入了全球范围内的主流大模型，并对这些模型进行持久的观察与评估。

腾讯混元是国内首个基于MoE架构的多模态大模型，在架构设计、训练策略及数据处理上进行了创新与深度优化，能够支持任意长宽比以及最高7K分辨率的图片理解。与其他多模态模型主要通过开源基准进行调优不同，腾讯混元更为关注模型的通用性、实用性和可靠性，展现出丰富的多模态场景理解能力。

在应用方面，腾讯混元多模态理解模型经过优化，面向通用场景和大量应用，积累了数千万相关问答数据，涵盖了图片基本理解、内容创作、推理分析、知识问答、OCR文档解析、学科答题等多个领域。它可以执行描述图片内容、将图片转换成文本表格、解释代码段、分析账单、解答数学题等多种任务。这些功能已在腾讯元宝APP上线，同时也可通过腾讯云API进行调用。除了本次评测的Hunyuan-vision模型外，上个月新发布的旗舰多模态理解模型Hunyuan-turbo-vision也具备更强大的能力。

作为一个实用级的大模型，腾讯混元多模态理解模型已经在腾讯的多种业务场景中广泛应用，包括QQ、QQ浏览器、腾讯文档、腾讯游戏、腾讯广告、微信读书以及微信小程序等。例如，在QQ说说中，用户可以自动为照片生成配文；在QQ浏览器中，用户可以输入照片让AI自动识别并解答问题；在小程序教育平台中，用户可以通过图片自动生成程序，从而提高开发效率。

此外，腾讯混元大模型在广告场景中的强大内容理解能力，为广告的个性化推荐、定位及效果预测提供了支持，有效提升了广告的精准度和用户的浏览体验。

QQ说说AI配文

QQ浏览器AI解题答疑

小程序教育平台-看图写小程序

多模态理解模型能够同步处理和解析多种模态的信息，从而实现更全面和深入的语义理解。通过整合不同类型的信息，它提升了AI在复杂任务中的表现，并为人工智能领域带来了新的发展机遇。展望未来，随着模型能力的持续提升，腾讯混元多模态理解模型将会推出更多在图片搜索、图片审核及视频理解等领域的深度应用。

编辑：侯宜均

来源：今日头条

原文标题：智源评测：大模型打擂台，多模态图文理解腾讯混元国内第一 – 今日头条

原文链接：https://toutiao.com/group/7454478492554854912/

正文完

国内冠军图文理解多模态智能评测腾讯

发表至： ChatGPT中文版

2025-10-03

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

使用智语AI写作智能工具，您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章，还是创作引人入胜的故事，AI助手都能为您提供丰富的素材和创意，激发您的写作灵感。您只需输入几个关键词或主题，AI便会迅速为您生成相关内容，让您在短时间内完成写作任务。
利用AI智能写作工具，轻松生成高质量内容。无论是文章、博客还是创意写作，我们的免费 AI 助手都能帮助你提升写作效率，激发灵感。来智语AI体验 ChatGPT中文版，开启你的智能写作之旅！

2023年中国AI大模型平台实力大比拼！

chatgpt中文版登录

chatgpt4.0中文

探讨ChatGPT中文版本的应用现状与未来发展：手机版、网页版、免付费版全解析

探秘ChatGPT中文版：如何轻松切换至中文界面与使用各种手机版本的全面指南

全方位解析ChatGPT中文版：从设置中文界面到手机版使用技巧，每一步都不容错过！

揭开ChatGPT中文版的面纱：如何轻松切换中文模式及最新手机版功能评测

chatgpt网页版在线试用

AI写论文的秘密：超出你想象的隐秘真相！

字节推出豆包App：学霸、聊天伙伴与专科老师齐聚，挑战快手AI！