共计 1477 个字符,预计需要花费 4 分钟才能阅读完成。
在 8 月 3 日,阿里云正式发布了其开源的通义千问 70 亿参数模型,其中包括通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat。这两款模型已在魔搭社区上线,完全免费且可供商业使用。阿里云因此成为国内首个进入大模型开源领域的大型科技企业。
通义千问的开源发布引发广泛关注!同日,AI 模型社区魔搭 ModelScope 推出了 Qwen-7B 和 Qwen-7B-Chat 这两款模型,阿里云确认它们分别代表通义千问的 70 亿参数通用和对话模型,这一开源、免费且可商用的举措,使其在行业中脱颖而出。在多项权威评测中,通义千问 7B 模型的表现超出了国内外同类模型,成为当前最强的中英文 7B 开源模型。
自今年 4 月推出自研大模型通义千问以来,市场需求激增。此次推出的小型化模型版本的开源,预计将降低模型使用的门槛,使得众多中小型企业和 AI 开发者能够更快、更早地接触到通义千问。这一行动再一次巩固了阿里云在国内大模型开源方面的领先地位。
Qwen-7B 作为多语言基座模型,经过超过 2 万亿 token 的数据集训练,具备 8k 的上下文窗口长度。而 Qwen-7B-Chat 则是基于该基座模型所开发的中英文对话模型,已成功实现与人类认知的对齐。开源代码同样支持对 Qwen-7B 和 Qwen-7B-Chat 的量化,用户可以在消费级显卡上顺利部署和运行这些模型。
用户不仅可以直接从魔搭社区下载这两款模型,还可以通过阿里云灵积平台进行访问和调用。阿里云为用户提供包括模型训练、推理、部署和微调等全面服务。
在多个权威基准评测中,通义千问 7B 模型的表现堪称卓越,其在中英文能力方面远超同等规模的开源模型,并在某些能力上甚至“跃级”超越 12B 和 13B 模型。
在英文能力的评测基准 MMLU 中,通义千问 7B 模型的得分超越了多款 7B、12B 及 13B 的主流开源模型。该基准评测涵盖 57 个学科的英文题目,综合考核人文学科、社会科学、自然科学等各个领域的知识与解决问题的能力。
在中文常识能力评测基准 C -Eval 中,通义千问在验证集和测试集中均为得分最高的 7B 开源模型,显示出其扎实的中文能力。相比于在英文领域蓬勃发展的 AI 开源生态,中文社区却缺乏优秀的基座模型。通义千问的加入有望为开源社区提供更多选择,从而推动中国 AI 开源生态的发展。
在数学解题能力评测 GSM8K 和代码能力评测 HumanEval 等基准中,通义千问 7B 模型同样展现出色的成绩,超越了所有同类开源模型以及部分大型开源模型。
阿里云强调,开源大模型的推出将简化用户的模型训练与部署流程,用户无需从头开始训练,只需下载预训练模型并稍作微调,便能迅速构建出高质量的模型。
附:开源地址
在魔搭 ModelScope 上:
https://modelscope.cn/models/qwen/Qwen-7B/summary
https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary
Hugging Face:https://huggingface.co/Qwen
GitHub:https://github.com/QwenLM/Qwen-7B
开源生态对推动中国大模型技术的进步及应用的落地至关重要。今年 7 月,阿里云宣布将中国大模型生态的繁荣作为其首要目标,致力于为大模型创业公司提供智能计算能力、开发工具等全面支持。自 2022 年起,阿里云发起了 AI 模型社区魔搭,旨在以 AI 模型为核心服务广大 AI 开发者。目前,魔搭已汇聚了 20 多家顶尖人工智能机构的 1000 多款开源模型,成为中国大模型开源的首要门户。(完 / 供图)
注:转载本文时请务必注明出处!