阿里通义千问Qwen3模型重磅升级:上下文窗口扩展至256K,4张H20显卡轻松部署!

共计 1151 个字符,预计需要花费 3 分钟才能阅读完成。

在7月22日,阿里巴巴通义千问团队正式推出了旗舰大模型Qwen3的重要版本更新。新版本被命名为
Qwen3-235B-A22B-Instruct-2507-FP8,属于非思维模式的提升版本。

此次更新最为显著的改进在于其长文本处理能力得到显著增强。模型的上下文窗口从之前的规格扩展至256K,这一技术进步将显著提升模型处理长篇文章和复杂对话的能力。这一长文本处理能力的提升对企业级应用及学术研究尤为重要。

据了解,更新后的Qwen3模型已经在魔搭社区与HuggingFace两个开源平台上同步发布。开发者与研究人员可以方便地通过这些平台获取模型资源,进行相关的开发与研究。

Qwen3系列模型采用混合专家架构设计,其总参数量达235B,但实际激活的参数仅为22B。这种设计不仅保持了高性能,还有效减少了计算资源的使用。模型的预训练数据量高达36TB,并经过多轮强化学习的优化。

在技术特性方面,Qwen3结合了快速反应与深度思考两种模式。当面对简单问题时,模型能够迅速给出答复;而在处理复杂任务时,则会启用多步骤推理机制。这种混合推理的设计既确保了响应的高效性,也保证了对复杂问题的处理质量。

在多项基准测试中,该模型表现优异。在数学推理能力评测AIME25中取得了81.5的高分,而在代码能力测试LiveCodeBench中也突破了70分。此外,在人类偏好对齐评估ArenaHard中,其得分高达95.6,超越多个国际知名模型。

在部署成本方面,Qwen3实现了显著的优化。完整版本仅需4张H20显卡即可部署,显存占用量仅为同类模型的三分之一。这一改进极大降低了模型应用的硬件门槛,为更多开发者和企业提供了便利。

该模型系列涵盖多个版本规格,参数量从0.6B到235B不等。每个版本均针对特定应用场景进行了优化,以满足从移动端到企业级部署的多样化需求。所有版本都支持混合推理功能,用户可根据实际需求调整思考深度。

在智能体应用支持方面,Qwen3原生支持MCP协议,具备强大的工具调用能力。结合Qwen-Agent框架,开发者可以更轻松地构建智能体应用,降低编程的复杂性。

该模型继续采用Apache2.0开源协议,支持119种语言的处理。全球的开发者、研究机构及企业均可免费使用并进行商业化应用。用户可以直接下载模型文件,或通过阿里云百炼等云服务平台调用API接口。

本文来源于金融界

来源:今日头条
原文标题:阿里通义千问Qwen3大模型更新,上下文窗口扩展至256K,4张H20显卡即可部署 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-11-12发表,共计1151字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!