共计 578 个字符,预计需要花费 2 分钟才能阅读完成。
快乐的 QwensWeek!Qwen3 推理模型正式发布!
全新开源的 Qwen3-235B-A22B-Thinking-2507 在推理能力和通用性方面实现了突破性的进展,其性能可与 Gemini-2.5 pro、O4-mini 等一流闭源模型媲美,并且刷新了全球开源模型的 SOTA 最佳表现:
- 在编程(LiveCodeBench)和数学(AIME25)等核心领域,Qwen3 推理模型展现了 进一步提高的推理性能;
- 在知识(SuperGPQA)、创意写作能力(WritingBench)、人类偏好对齐(Arena-Hard v2)以及多语言能力(MultilF)等 通用能力 上,Qwen3 推理模型同样取得了显著的进步;
- 该新模型支持 256K 的长文本理解,轻松应对超长上下文的处理。
欢迎大家从 推理效果 、 工程集成 、 成本控制 、 上下文管理 等多方面,分享你在使用或评估 Qwen3-235B-A22B-Thinking-2507 过程中的 真实体验 与深刻见解!
来源:知乎
原文标题:如何评价阿里一周内推出的第三款开源模型 Qwen3-235B-A22B-Thinking-2507?– 知乎
声明:
文章来自网络收集后经过 ai 改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完

