阿里通义实验室黄斐：开源迈入千问新时代，革新推理模型即将上线！

共计 1794 个字符，预计需要花费 5 分钟才能阅读完成。

阿里巴巴的通义千问系列已经成为全球最大的开源模型系列，预计不久后将发布基于最新的Qwen2.5-Max的推理模型。

在2月21日于上海举办的全球开发者大会（GDC）上，阿里巴巴通义实验室的科学家黄斐在论坛上指出，通义千问（Qwen）系列模型的下载次数已达到1.8亿，衍生模型的总数已达9万个，超越了Meta的Llama系列，成为全球首屈一指的开源模型系列，这一成绩也在Hugging Face等第三方平台获得了良好的反馈。“因此，我们可以自信地说，现在是千问的时代，而不是Llama的时代。”黄斐强调。

今年1月底，阿里正式推出了AI基础大模型Qwen2.5-Max，并在多个权威基准测试中表现优异。黄斐提到，Qwen2.5-Max的性能已超越了DeepSeek-V3，但尚未达到DeepSeek-R1推理模型的水平。正如阿里巴巴集团的CEO吴泳铭所提及的，通义千问正在基于Qwen2.5-Max构建推理模型，并表示“很快会推出这一模型”。

根据黄斐的介绍，Qwen2.5系列已经开放了7个不同规模的稠密（Dense）模型，采用传统的Transformer架构，规模从最小的0.5B到最大72B，满足了不同应用场景的需求，性能和速度各不相同。此外，通义千问系列在迭代过程中，预训练数据的规模从Qwen1.5-72B的3T增长至Qwen2.5-72B的18T，利用规模效应取得了显著成效。

除此之外，Qwen2.5还提供了三个基于MoE（混合专家模型）架构的API模型。这些模型在Dense模型的基础上进行了扩展，以降低训练成本，用户可以通过API调用这三个版本，包括Turbo、Plus和Max。

黄斐进一步揭示了千问系列备受欢迎的原因之一，即其支持中、英、日、韩以及西欧多种语言，覆盖超过29种语言。他表示：“千问在东南亚国家的使用频率非常高，语言支持的丰富性使其在众多模型中脱颖而出。”

谈及未来的发展方向，黄斐提到推理模型、更加智能的模型以及全能模型。他解释道，未来将推出的千问推理模型“将优于现有版本”，而“更智能的模型”不仅在智能水平上更高，还具备更快的响应速度和更低的成本。全能模型则指的是可以处理多模态输入输出的模型，实现更大的灵活性。

黄斐认为，除了模型本身，AI Agent（智能代理）也是一个值得关注的领域。他指出：“在未来一段时间，AI Agent必将成为热门话题。它能够帮助我们解决复杂任务，尤其是结合目前推理模型的发展，许多行业都可以利用这一模型的能力，完成原本只能由人类完成的工作。”

在该论坛上，魔搭社区技术负责人陈颖达介绍，自2022年11月成立以来，魔搭社区的模型总量已超过4.5万个，涵盖了大语言模型、对话、语音、图文生成、视频生成、AI作曲等多个领域，已为超过1100万开发者提供服务。

在GDC大会上，阿里云魔搭社区首次发布了两款最新的多模态开源模型，包括全球参数量最大的开源视频生成模型Step-Video-T2V，以及业界首款产品级开源语音交互模型Step-Audio。其中，Step-Video-T2V是基于300亿参数的文本转视频预训练模型，能够生成高达204帧的视频；而Step-Audio则是业界首个产品级开源语音模型，参数规模超过1300亿。目前，这两款模型均可在魔搭社区下载和体验。

在2月20日晚，阿里巴巴集团公布了新一季度的财务报告，显示营收达2801.5亿元，预计为2773.7亿元，同比增长8%。阿里云的季度营收为317.42亿元，同比增长13%，公共云收入持续实现两位数增长，AI相关收入连续六个季度实现三位数增长，调整后EBITA增长33%至31.38亿元。

阿里巴巴集团的CEO吴泳铭在财报会上表示，展望未来，阿里巴巴将继续聚焦于三大业务：国内外电商、AI与云计算的技术业务、以及互联网平台产品。在未来三年内，阿里将围绕AI这一战略核心，在基础设施、基础模型平台及AI原生应用、现有业务的AI转型等方面加大投资。预计未来三年在云和AI基础设施的投入将超过过去十年的总和。

澎湃新闻记者胡含嫣

(本文来自澎湃新闻，更多原创资讯请下载“澎湃新闻”APP)

来源：今日头条

原文标题：阿里通义实验室黄斐：开源进入千问时代，即将发布的推理模型会更好用 – 今日头条

原文链接：https://toutiao.com/group/7473883292891087375/

正文完