阿里云通义千问震撼开源！70亿参数模型正式登陆魔搭社区，免费商用等你来体验！

共计 1477 个字符，预计需要花费 4 分钟才能阅读完成。

在 8 月 3 日，阿里云正式发布了其开源的通义千问 70 亿参数模型，其中包括通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat。这两款模型已在魔搭社区上线，完全免费且可供商业使用。阿里云因此成为国内首个进入大模型开源领域的大型科技企业。

通义千问的开源发布引发广泛关注！同日，AI 模型社区魔搭 ModelScope 推出了 Qwen-7B 和 Qwen-7B-Chat 这两款模型，阿里云确认它们分别代表通义千问的 70 亿参数通用和对话模型，这一开源、免费且可商用的举措，使其在行业中脱颖而出。在多项权威评测中，通义千问 7B 模型的表现超出了国内外同类模型，成为当前最强的中英文 7B 开源模型。

自今年 4 月推出自研大模型通义千问以来，市场需求激增。此次推出的小型化模型版本的开源，预计将降低模型使用的门槛，使得众多中小型企业和 AI 开发者能够更快、更早地接触到通义千问。这一行动再一次巩固了阿里云在国内大模型开源方面的领先地位。

Qwen-7B 作为多语言基座模型，经过超过 2 万亿 token 的数据集训练，具备 8k 的上下文窗口长度。而 Qwen-7B-Chat 则是基于该基座模型所开发的中英文对话模型，已成功实现与人类认知的对齐。开源代码同样支持对 Qwen-7B 和 Qwen-7B-Chat 的量化，用户可以在消费级显卡上顺利部署和运行这些模型。

用户不仅可以直接从魔搭社区下载这两款模型，还可以通过阿里云灵积平台进行访问和调用。阿里云为用户提供包括模型训练、推理、部署和微调等全面服务。

在多个权威基准评测中，通义千问 7B 模型的表现堪称卓越，其在中英文能力方面远超同等规模的开源模型，并在某些能力上甚至“跃级”超越 12B 和 13B 模型。

在英文能力的评测基准 MMLU 中，通义千问 7B 模型的得分超越了多款 7B、12B 及 13B 的主流开源模型。该基准评测涵盖 57 个学科的英文题目，综合考核人文学科、社会科学、自然科学等各个领域的知识与解决问题的能力。

在中文常识能力评测基准 C -Eval 中，通义千问在验证集和测试集中均为得分最高的 7B 开源模型，显示出其扎实的中文能力。相比于在英文领域蓬勃发展的 AI 开源生态，中文社区却缺乏优秀的基座模型。通义千问的加入有望为开源社区提供更多选择，从而推动中国 AI 开源生态的发展。

在数学解题能力评测 GSM8K 和代码能力评测 HumanEval 等基准中，通义千问 7B 模型同样展现出色的成绩，超越了所有同类开源模型以及部分大型开源模型。

阿里云强调，开源大模型的推出将简化用户的模型训练与部署流程，用户无需从头开始训练，只需下载预训练模型并稍作微调，便能迅速构建出高质量的模型。

附：开源地址

在魔搭 ModelScope 上：

https://modelscope.cn/models/qwen/Qwen-7B/summary

https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary

Hugging Face：https://huggingface.co/Qwen

GitHub：https://github.com/QwenLM/Qwen-7B

开源生态对推动中国大模型技术的进步及应用的落地至关重要。今年 7 月，阿里云宣布将中国大模型生态的繁荣作为其首要目标，致力于为大模型创业公司提供智能计算能力、开发工具等全面支持。自 2022 年起，阿里云发起了 AI 模型社区魔搭，旨在以 AI 模型为核心服务广大 AI 开发者。目前，魔搭已汇聚了 20 多家顶尖人工智能机构的 1000 多款开源模型，成为中国大模型开源的首要门户。(完 / 供图)

注：转载本文时请务必注明出处！

正文完