共计 383 个字符,预计需要花费 1 分钟才能阅读完成。
在各项基准测试中,旗舰型号 Qwen3-235B-A22B 的表现令人瞩目,尤其在代码、数学和通用能力方面,展现出与 DeepSeek-R1、o1、o3-mini、Grok- 3 以及 Gemini-2.5-Pro 等顶尖模型的强烈竞争力。此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量仅为 QwQ-32B 的 10%,其表现更是令人惊叹,甚至连 Qwen3-4B 这样的小型模型也能与 Qwen2.5-72B-Instruct 相媲美。
二十万预算能否驾驭Qwen3-235B-A22B服务器?
非推理模型与推理模型中的幻觉:定义与具体表现的深度解析