阿里通义千问Qwen3模型重磅升级：上下文窗口扩展至256K，4张H20显卡轻松部署！

没有评论

共计 1151 个字符，预计需要花费 3 分钟才能阅读完成。

在7月22日，阿里巴巴通义千问团队正式推出了旗舰大模型Qwen3的重要版本更新。新版本被命名为
Qwen3-235B-A22B-Instruct-2507-FP8，属于非思维模式的提升版本。

此次更新最为显著的改进在于其长文本处理能力得到显著增强。模型的上下文窗口从之前的规格扩展至256K，这一技术进步将显著提升模型处理长篇文章和复杂对话的能力。这一长文本处理能力的提升对企业级应用及学术研究尤为重要。

据了解，更新后的Qwen3模型已经在魔搭社区与HuggingFace两个开源平台上同步发布。开发者与研究人员可以方便地通过这些平台获取模型资源，进行相关的开发与研究。

Qwen3系列模型采用混合专家架构设计，其总参数量达235B，但实际激活的参数仅为22B。这种设计不仅保持了高性能，还有效减少了计算资源的使用。模型的预训练数据量高达36TB，并经过多轮强化学习的优化。

在技术特性方面，Qwen3结合了快速反应与深度思考两种模式。当面对简单问题时，模型能够迅速给出答复；而在处理复杂任务时，则会启用多步骤推理机制。这种混合推理的设计既确保了响应的高效性，也保证了对复杂问题的处理质量。

在多项基准测试中，该模型表现优异。在数学推理能力评测AIME25中取得了81.5的高分，而在代码能力测试LiveCodeBench中也突破了70分。此外，在人类偏好对齐评估ArenaHard中，其得分高达95.6，超越多个国际知名模型。

在部署成本方面，Qwen3实现了显著的优化。完整版本仅需4张H20显卡即可部署，显存占用量仅为同类模型的三分之一。这一改进极大降低了模型应用的硬件门槛，为更多开发者和企业提供了便利。

该模型系列涵盖多个版本规格，参数量从0.6B到235B不等。每个版本均针对特定应用场景进行了优化，以满足从移动端到企业级部署的多样化需求。所有版本都支持混合推理功能，用户可根据实际需求调整思考深度。

在智能体应用支持方面，Qwen3原生支持MCP协议，具备强大的工具调用能力。结合Qwen-Agent框架，开发者可以更轻松地构建智能体应用，降低编程的复杂性。

该模型继续采用Apache2.0开源协议，支持119种语言的处理。全球的开发者、研究机构及企业均可免费使用并进行商业化应用。用户可以直接下载模型文件，或通过阿里云百炼等云服务平台调用API接口。

本文来源于金融界

来源：今日头条

原文标题：阿里通义千问Qwen3大模型更新，上下文窗口扩展至256K，4张H20显卡即可部署 – 今日头条

原文链接：https://www.toutiao.com/article/7529709884637299263/

声明：

文章来自网络收集后经过ai改写发布，如不小心侵犯了您的权益，请联系本站删除，给您带来困扰，深表歉意！

正文完

Qwen3 大模型显卡部署机器学习阿里巴巴

发表至：通义千问

2025-11-12

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

使用智语AI写作智能工具，您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章，还是创作引人入胜的故事，AI助手都能为您提供丰富的素材和创意，激发您的写作灵感。您只需输入几个关键词或主题，AI便会迅速为您生成相关内容，让您在短时间内完成写作任务。
利用AI智能写作工具，轻松生成高质量内容。无论是文章、博客还是创意写作，我们的免费 AI 助手都能帮助你提升写作效率，激发灵感。来智语AI体验 ChatGPT中文版，开启你的智能写作之旅！

王炸组合揭示的深意：Manus与通义千问的强强联手！

阿里推出全新全模态大模型Qwen3-Omni，引领智能问答新时代！

阿里通义App推出“千问3”，夸克全线接入引发热议！

阿里通义千问 Qwen 以22.32%收益率赢得AI大模型投资比赛冠军！

全国首起AI大模型商标侵权案：武汉公司因假冒“通义千问”被判赔23万元

阿里通义千问大模型荣获世界互联网大会领先科技奖，开源开放引领未来！

首款搭载阿里通义千问与Agent生态的AI手机震撼发布！

阿里通义千问发布多模态模型Qwen VLo：打破感知与生成的界限！

万亿参数强势来袭！通义千问模型满分上线引爆科技界

AI写作平台速成秘籍！掌握这些技巧，让你的创作轻松翻倍！