《赛道Hyper：通义千问万亿模型的战略突破全面解析》

共计 2546 个字符，预计需要花费 7 分钟才能阅读完成。

作者：周源 / 华尔街见闻

在 9 月 6 日的凌晨，阿里巴巴旗下的通义千问（Qwen）于官网上发布了 Qwen3-Max-Preview（Instruct），这款预览版超大型模型的参数量已突破 1 万亿。

阿里方面表示，这一模型在中英文理解、复杂指令执行和工具调用（RAG/Tool-calling）等多个方面实现了显著的提升，并在设计上有效减少了知识幻觉的现象；同时，Preview 版本现已在 Qwen Chat 及阿里云模型平台上可以进行试用及 API 调用。

阿里官方将 Qwen3-Max-Preview 定义为 Qwen3 系列中“迄今为止最大且专注于指令任务”的模型，并特别强调了两项关键内容：其一是“指令遵循与工具调用”作为主要优化方向，其二是同时向自家产品（Qwen Chat）和商业开发者（如阿里云模型服务和百炼平台）开放部署通道。

这两项举措表明，这款超大模型不仅是产品的宣传，也是阿里在推动模型服务化方面的重要行动。

该模型的突出之处，可以从三个可验证的方面来看：超大参数规模（超过 1 万亿）、可通过云平台和聊天产品调用，以及在一些公开和私有基准上取得的相对优势。

通义千问近期推出了多款侧重点各异的大模型，这背后的思考又是什么呢？

阿里巴巴的 CEO 吴泳铭（Eddie Wu）曾公开表示：“我们的主要目标是构建一个能够超越人类智能的——‘人工通用智能’（AGI：Artificial General Intelligence）系统。所有 Qwen3 模型均为开源，这体现了我们对开放社区和产业创新的长期承诺。”

那么，阿里为何将“指令 + 工具”放在首位呢？

通义团队在 Qwen3 的技术报告中提出的诸多框架（如思考与非思考模式、混合密集与 MoE 架构、可控的思考预算机制）为 Max 版的演变奠定了理论基础。

Qwen3 的技术发展路线并非单纯追求参数的增加，而是将“模式切换”“预算分配”“多模态兼容”作为可控因素，这使得在参数规模达到万亿时，能够更迅速地适应实际任务的需求。

在 Max-Preview 的具体描述中，阿里将减少“知识幻觉”和增强“工具调用”并列为核心改进点：前者关注输出的可信度和事实性（对企业级应用至关重要），后者则直接影响将大模型嵌入企业流程、调用检索 / 数据库 / 执行工具时的可靠性。

换句话说，产品化路径已从“更会说”转向“更能做”（actionable），这是阿里推动模型作为平台产品的市场逻辑。

华尔街见闻注意到，近期国内外多家厂商纷纷推出超大规模或面向 AI Agent 的模型，例如 Moonshot（月之暗面）的 Kimi K2、DeepSeek 的 V3.1，以及国外的 Anthropic（Claude Opus）等。

这些模型在架构选择（MoE 与 Dense）、实际激活参数与峰值参数（激活与总参数）、以及对 Agent/ 工具的内建支持等方面存在显著差异。

Kimi 及一些国内团队采用 MoE 路线以降低推理成本，同时提升模型的覆盖范围；DeepSeek 则强调混合推理模式（思考与非思考）以及国内生态的快速迭代；而 Anthropic 则将 AI Agent 与长期推理能力作为其差异化竞争点。

相较之下，阿里这次选择以“Instruct + 工具调用优化 + 可商用平台”的方式先行推出 Max，展现了其对可用性与生态接入的重视。

值得注意的是，参数的绝对值并不等同于产品的优势：MoE 类模型在“总参数”上能够达到极大规模，但在实际推理时的激活参数却较小，其成本结构也有所不同——此次阿里没有披露该超大模型的参数激活量数据。

此外，开放策略（开源、预览、闭源商用）会直接影响社区生态与二次创新的速度。阿里在过去两年中已有 Qwen3 系列的开源实践与社区积累，这使得 Max 在面向用户与开发者时，与完全闭源的竞品路径存在根本差异。

Qwen3-Max 以 Preview 形式在 Qwen Chat 与阿里云平台上线，表明阿里将这一模型视为“平台能力”来推广：企业可以通过 API、RAG 流程和工具链将模型嵌入已有的客服、知识库检索、企业内网搜索和自动化代理等业务系统中。

这种路径的商业价值并不在于单一模型的销售，而在于通过平台所带来的长期黏性与增值服务，例如检索、定制化 fine-tune、工具链托管和合规治理。

目前，阿里已经在电商、金融、企业服务等多个场景中拥有切入的机会，Max 作为“更能调用工具、减少幻觉”的能力自然有其明确的落地场景。

对于开发者和第三方厂商来说，Preview 版既是检验标准也是挑战：它可以验证 Max 在真实数据和业务流程中的表现；而挑战则在于成本、接入复杂度及合规要求。

若阿里能够在工具链的稳定性、检索的可信度以及接入模板上提供低成本的工程化支持，那么便可将技术优势转化为生态优势。

从近期行业的整体动向来看，大模型之争已从单一模型的竞争转向整体系统的争夺。

阿里推出的 Qwen3-Max-Preview，实际上是在将“大模型转化为企业可用能力”这一领域的一次明显推进。

在 9 月 5 日，华尔街见闻从一家服装巨头的 CIO 与 HR 总监处了解到，该公司已利用阿里钉钉平台上自带的 GenAI 工具，迅速重构了从潮流趋势的确定到设计、生产、陈列、销售、反馈及售后的一系列业务流程。

这与阿里将 GenAI 技术以不同形式重塑 B 端公司实务，达成吴泳铭所称的“产业创新”策略的目标一致。

此次推出的超大模型也延续了相似的思路：将焦点从单纯的参数规模转向“指令遵循、工具调用与减少幻觉”的工程化可用性；并通过 Qwen Chat 与阿里云两条通道迅速聚拢用户与付费场景。

与此同时，业内以 Kimi、DeepSeek、Anthropic 为代表的不同路线也在努力通过各自的架构、开放策略与商业策略占据市场位置。

最终的胜利者，将不是参数最多的那一方，而是能够在合规、工程化、生态和成本之间实现平衡的参与者。

进一步检验 Qwen3-Max 的价值，还需时间和第三方评测来验证其在复杂企业场景（如长期对话、工具链调用、知识闭环）中的稳定性和成本效益。

同时，监管和平台治理将会决定这种超大模型能否在更大规模的公众与行业应用中持续存在。阿里的这一举措既是加码也是试探；真正的变数在于生态是否能转化为可持续的商业与治理能力。

本文来自华尔街见闻，欢迎下载 APP 查看更多

正文完

人工智能指令任务模型服务超大型模型通义千问

发表至：通义千问

2025-09-21

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

阿里云推出自研大模型“通义千问”，深度实测带你全方位了解！

阿里通义千问Qwen3-Max全新深度思考模式上线，AI动态资讯速递！

通义千问推出Qwen3-Max-Preview，参数量突破1万亿大关！

全国首起AI大模型商标侵权案：武汉公司因假冒“通义千问”被判赔23万元

深度解析阿里云大模型“通义千问”：逻辑判断准确，时事新闻却频频失误！

阿里通义千问 Qwen 以22.32%收益率赢得AI大模型投资比赛冠军！

中国AI模型通义千问全球市场份额突破10.4%，成功超越OpenAI荣登第四！

阿里云推出“通义千问”，助力企业轻松打造大模型！

刘庆峰：星火AI大模型或将首度实现考取清华北大的梦想

《赛道Hyper：通义千问万亿模型的战略突破全面解析》

Qwen3-Max-Preview 的真正含义

阿里在赌实用的集成价值？

AI生成图像的版权归属：如何确保“人类智慧”的合法性？

AI写作指南大揭秘：你还在为文思枯竭而烦恼吗？

国内文生图工具大比拼：梦、可灵、豆包等应用场景与提示词秘诀全解析

人人都能掌握的AI设计秘籍：打造你的万能文生图提示框架！

快手推出全新文生图大模型“可图”！

AI 成果“过度包装”：GPT-5 数学能力的质疑与反思

你有没有试过？这个免费AI语音合成软件超好用，轻松变身配音高手！

警惕！使用 Cursor CLI 的朋友们，这8大雷区千万别踩！