共计 1794 个字符,预计需要花费 5 分钟才能阅读完成。
阿里巴巴的通义千问系列已经成为全球最大的开源模型系列,预计不久后将发布基于最新的Qwen2.5-Max的推理模型。
在2月21日于上海举办的全球开发者大会(GDC)上,阿里巴巴通义实验室的科学家黄斐在论坛上指出,通义千问(Qwen)系列模型的下载次数已达到1.8亿,衍生模型的总数已达9万个,超越了Meta的Llama系列,成为全球首屈一指的开源模型系列,这一成绩也在Hugging Face等第三方平台获得了良好的反馈。“因此,我们可以自信地说,现在是千问的时代,而不是Llama的时代。”黄斐强调。
今年1月底,阿里正式推出了AI基础大模型Qwen2.5-Max,并在多个权威基准测试中表现优异。黄斐提到,Qwen2.5-Max的性能已超越了DeepSeek-V3,但尚未达到DeepSeek-R1推理模型的水平。正如阿里巴巴集团的CEO吴泳铭所提及的,通义千问正在基于Qwen2.5-Max构建推理模型,并表示“很快会推出这一模型”。
根据黄斐的介绍,Qwen2.5系列已经开放了7个不同规模的稠密(Dense)模型,采用传统的Transformer架构,规模从最小的0.5B到最大72B,满足了不同应用场景的需求,性能和速度各不相同。此外,通义千问系列在迭代过程中,预训练数据的规模从Qwen1.5-72B的3T增长至Qwen2.5-72B的18T,利用规模效应取得了显著成效。
除此之外,Qwen2.5还提供了三个基于MoE(混合专家模型)架构的API模型。这些模型在Dense模型的基础上进行了扩展,以降低训练成本,用户可以通过API调用这三个版本,包括Turbo、Plus和Max。
黄斐进一步揭示了千问系列备受欢迎的原因之一,即其支持中、英、日、韩以及西欧多种语言,覆盖超过29种语言。他表示:“千问在东南亚国家的使用频率非常高,语言支持的丰富性使其在众多模型中脱颖而出。”
谈及未来的发展方向,黄斐提到推理模型、更加智能的模型以及全能模型。他解释道,未来将推出的千问推理模型“将优于现有版本”,而“更智能的模型”不仅在智能水平上更高,还具备更快的响应速度和更低的成本。全能模型则指的是可以处理多模态输入输出的模型,实现更大的灵活性。
黄斐认为,除了模型本身,AI Agent(智能代理)也是一个值得关注的领域。他指出:“在未来一段时间,AI Agent必将成为热门话题。它能够帮助我们解决复杂任务,尤其是结合目前推理模型的发展,许多行业都可以利用这一模型的能力,完成原本只能由人类完成的工作。”
在该论坛上,魔搭社区技术负责人陈颖达介绍,自2022年11月成立以来,魔搭社区的模型总量已超过4.5万个,涵盖了大语言模型、对话、语音、图文生成、视频生成、AI作曲等多个领域,已为超过1100万开发者提供服务。
在GDC大会上,阿里云魔搭社区首次发布了两款最新的多模态开源模型,包括全球参数量最大的开源视频生成模型Step-Video-T2V,以及业界首款产品级开源语音交互模型Step-Audio。其中,Step-Video-T2V是基于300亿参数的文本转视频预训练模型,能够生成高达204帧的视频;而Step-Audio则是业界首个产品级开源语音模型,参数规模超过1300亿。目前,这两款模型均可在魔搭社区下载和体验。
在2月20日晚,阿里巴巴集团公布了新一季度的财务报告,显示营收达2801.5亿元,预计为2773.7亿元,同比增长8%。阿里云的季度营收为317.42亿元,同比增长13%,公共云收入持续实现两位数增长,AI相关收入连续六个季度实现三位数增长,调整后EBITA增长33%至31.38亿元。
阿里巴巴集团的CEO吴泳铭在财报会上表示,展望未来,阿里巴巴将继续聚焦于三大业务:国内外电商、AI与云计算的技术业务、以及互联网平台产品。在未来三年内,阿里将围绕AI这一战略核心,在基础设施、基础模型平台及AI原生应用、现有业务的AI转型等方面加大投资。预计未来三年在云和AI基础设施的投入将超过过去十年的总和。
澎湃新闻记者 胡含嫣
(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)
