阿里云通义千问2.0重磅发布!综合性能超越GPT-3.5,APP全新上线!

共计 3420 个字符,预计需要花费 9 分钟才能阅读完成。

智东西

作者 | ZeR0

编辑 | 漠影

在2023云栖大会上,阿里云于10月31日宣布推出其最新的大规模参数模型——通义千问2.0。该模型在十项权威评测中,其整体性能超越了GPT-3.5和Llama 2,并正在迅速缩小与GPT-4之间的差距。同时,通义千问APP也在当天正式上线,用户可通过该应用直接体验这一新模型的强大功能。

阿里云的CTO周靖人表示,阿里云将致力于智能时代的全面技术创新,从基础运算能力到人工智能平台,再到模型服务,全面升级其云计算体系,构建一个开放的AI云环境。除了推出通义千问2.0外,周靖人还介绍了云计算基础能力的最新进展,包括AI平台的升级和一站式模型应用开发平台阿里云百炼的发布。

周靖人进一步指出,目前中国有一半的大模型企业在阿里云上运行,阿里云魔搭社区活跃着280万名AI开发者。未来,阿里云计划开源通义千问72B版本,成为国内参数量最大的开源模型。此前,阿里云已开源了7B和14B的模型版本,总下载量已经超过100万次。

一、通义千问2.0超越GPT-3.5,八大行业大模型发布

在过去半年的发展中,通义千问2.0在性能上取得了显著进展。与四月发布的1.0版本相比,新版本在复杂指令理解、文学创作、通用数学、知识记忆以及抵御幻觉等方面都有了明显提升。目前,通义千问的综合性能已超越GPT-3.5,并在快速追赶GPT-4。

在MMLU、C-Eval、GSM8K、HumanEval、MATH等十大主流Benchmark评测中,通义千问2.0的得分整体超越了Meta的Llama-2-70B,相较于OpenAI的Chat-3.5则为九胜一负,而与GPT-4的对比中则是四胜六负,表明与GPT-4的差距正在逐步缩小。

大语言模型的基础在于其中英文理解能力。在英语任务方面,通义千问2.0在MMLU基准上得分为82.5,仅次于GPT-4。通过显著增加参数量,通义千问2.0能够更有效地解析和处理复杂的语言结构及其概念;在中文任务上,通义千问2.0凭借明显优势在C-Eval基准中取得最高得分,这得益于其在训练过程中吸收了更多中文语料,从而增强了中文理解和表达的能力。

在数学推理和代码理解等领域,通义千问2.0同样表现突出。在推理基准测试GSM8K中,其排名第二,展现出强大的计算和逻辑推理能力;在HumanEval测试中,通义千问的得分紧随GPT-4和GPT-3.5,该测试主要考察大模型对代码片段的理解和执行能力,这对大模型在编程辅助和自动代码修复等应用场景至关重要。

通义千问2.0在指令遵循、工具使用、精细化创作等方面进行了技术优化,使其更加易用,能够更好地集成于下游应用场景。此外,通义大模型官网上线了多模态和插件功能,支持图片输入和文档解析等细分任务。

同时,基于通义大模型训练的八大行业专属模型也相继推出,分别是通义灵码智能编码助手、通义智文AI阅读助手、通义听悟工作学习AI助手、通义星尘个性化角色创作平台、通义点金智能投研助手、通义晓蜜智能客服、通义仁心个人专属健康助手和通义法睿AI法律顾问。

其中,智能编码助手通义灵码已在阿里云内部得到了广泛应用,并取得了良好的反馈;工作学习AI助手通义听悟每天处理超过5万条音视频,累计用户超过100万。

这八大行业模型针对当前最受欢迎的多个垂直领域,使用特定领域的数据进行专门训练。用户可以在官网直接体验这些模型的功能,而开发者则可以通过网页嵌入、API或SDK调用等方式,将模型能力整合到自己的大模型应用和服务中。

截至10月,阿里云与超过60个行业领军合作伙伴建立了深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等多个领域的落地应用。

二、“中国一半的大模型公司使用阿里云”

阿里云的通义大模型系列是基于其人工智能平台PAI进行训练的。

据悉,除了通义大模型外,中国已有一半的大模型公司在阿里云上运营,像百川智能、智谱AI、零一万物、昆仑万维、vivo和复旦大学等众多知名企业和机构均在阿里云上训练其大模型。

通义系列、Baichuan系列、智谱AI的ChatGLM系列以及姜子牙通用大模型等国内多个主流大模型,均通过阿里云提供API服务。

“百川智能在成立半年后便发布了七款大模型,快速迭代的背后离不开云计算的支持。”百川智能的创始人兼CEO王小川表示。

百川智能与阿里云展开深入合作,双方共同努力下,百川成功完成了千卡大模型的训练任务,有效降低了模型推理成本并提升了模型的部署效率。

基础模型的质量在很大程度上影响着AI产业化的前景。训练大模型是一个涵盖算力基础、网络、存储、大数据、AI框架和AI模型等复杂技术的系统性工程,只有强大的云计算体系才能培养出高质量的大模型。

周靖人提到,阿里云在2009年就提出了“数据中心就是一台计算机”的理念,而在AI时代,这一技术体系显得尤为重要。作为一台超级计算机,云计算能够高效连接异构计算资源,打破单一性能芯片的瓶颈,协同完成大规模的智能计算任务。

为确保大模型训练的稳定互联和高效并行计算,阿里云全新升级了其人工智能平台PAI。

PAI底层架构采用了新一代HPN 7.0 AI集群网络,支持高达10万卡的集群扩展,超大规模的分布式训练加速比达96%,远超行业标准;在大模型训练任务中,算力资源节省可超过50%,性能处于全球领先水平。

为应对大规模智能计算的需求,阿里云在全球30个地区建立了89个云计算数据中心,提供3000多个边缘计算节点,以发挥云计算低延迟和高弹性的优势。今年,阿里云成功支撑了全网火爆的妙鸭相机在短时间内的高强度流量爆发。

三、超30款云产品接入大模型能力,推出一站式大模型应用开发平台

周靖人表示:“随着大模型技术与云计算的深度融合,我们希望未来的云计算能实现自动驾驶,极大提升开发者的使用体验。”

据悉,阿里云上已有超过30款云产品接入了大模型能力。例如,阿里云大数据治理平台DataWorks新增的交互形式Copilot,用户只需用自然语言输入便可生成SQL,并自动执行对应的数据ETL操作,整体开发效率提升超过30%,可谓“自动驾驶”的应用。

阿里云的容器和数据库等产品也提供了类似的开发体验,支持NL2SQL、SQL注释生成、纠错和优化等功能,未来这些能力还将集成到阿里云的其它产品中。

现场,周靖人还推出了一款一站式大模型应用开发平台——阿里云百炼。

该平台整合了国内外主流的优质大模型,提供模型选择、微调训练、安全套件、模型部署等服务,以及全链路的应用开发工具,简化了用户在底层算力部署、模型预训练和工具开发等复杂工作。

开发者在5分钟内就可开发出一款大模型应用,几个小时便可“炼”出一个企业专属模型,将更多精力集中于应用创新之上。

大模型正在引发各行各业的新一轮创新,央视网、朗新科技、亚信科技等企业已在阿里云百炼上开发专属模型和应用,朗新科技在云上训练出电力专属大模型,开发了“电力账单解读智能助手”和“电力行业政策解析及数据分析助手”,有效提升客户接待效率50%,投诉率降低70%。

周靖人表示:“促进中国AI生态的繁荣是阿里云的首要目标。我们将坚定不移地打造AI时代最开放的大模型平台,欢迎所有大模型接入阿里云百炼,共同为开发者提供AI服务。”

结语:向开发者提供免费GPU算力,已构建中国最大的AI社区

阿里云不仅与开发者共享自研的新技术,还全力支持第三方大模型的发展。在阿里云魔搭社区,百川智能、智谱AI、上海人工智能实验室和IDEA研究院等业界顶级玩家,纷纷开源发布他们的核心大模型。而阿里云则为开发者提供免费GPU算力,截至目前已超过3000万小时。

周靖人透露,魔搭社区目前汇聚了2300多款AI模型,吸引了280万AI开发者,AI模型下载量已突破1亿,成为中国规模最大、开发者最活跃的AI社区。

在2023云栖大会上,阿里云还公布了一项重要计划:“云工开物计划”,将为中国所有大学生每人提供一台云服务器。

此外,阿里云还将为签约高校提供更多的算力资源支持,助力中国青年学者和学生攀登科研高峰。目前,清华大学、北京大学、浙江大学、上海交通大学、中国科学技术大学和华南理工大学等高校已达成首批合作。

来源:今日头条
原文标题: 阿里云通义千问 2.0 发布!综合性能超过 GPT-3.5,APP 正式上线 – 今日头条
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-10-02发表,共计3420字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!