共计 1400 个字符,预计需要花费 4 分钟才能阅读完成。
中新社北京3月25日电 (记者 夏宾) 今年以来,中国的开源大模型消息层出不穷。
阿里云的通义千问在除夕夜推出了全新的视觉模型Qwen2.5-VL,并在本月初发布并开源了新的推理模型QwQ-32B,开源当天便迅速占据了全球主流AI开源社区Hugging Face的趋势榜首。
DeepSeek(深度求索)在2月底举行了“开源周”,连续五天发布五个代码库,并在近期上线了升级版的DeepSeek-V3模型。
阶跃星辰也在一个月内开源了三款多模态大模型,其中最新发布的是图生视频模型Step-Video-TI2V,具备运动幅度可控和镜头运动可控的核心特点,同时还自带特效生成能力。
那么,为什么开源大模型在中国成为一种发展趋势呢?FutureLabs未来实验室的首席专家胡延平对中新社记者指出,当前大模型厂商普遍选择开源,这一现象的背后是人工智能发展所处的四个关键时刻。
首先,端侧智能需求的崛起,尤其是个人在单机上部署AI的需求,推动了端侧智能的快速发展。
其次,企业对行业AI部署的需求不断增加,几乎各行各业都在急剧提升对AI的需求,然而通用的云端大模型却难以满足不同业务场景和数据隐私保护的要求。开源模型凭借其灵活性和定制化优势,成为企业实现差异化部署的理想选择,充分展现出其应变能力的明显优势。
根据中新社记者获得的数据,截至3月25日,通义千问开源的Qwen系列模型全球下载量已经超过2亿次。通过众多开发者和中小企业的参与,通义大模型已广泛应用于医疗、教育、金融、电力、交通、计算机等多个行业。
第三,AI产业生态化进入加速阶段,出现了更加明确的分工与协作体系。大型企业专注于模型能力的增强,而中小企业则基于开源模型开发特定场景的应用,形成了数量庞大的产业中游企业和大模型的后市场,这样的生态分工逐渐得到明确化。
最后,AI大模型的能力显著提升,从“可用”阶段进入“高可用”阶段,用户和应用因此迎来了爆发式增长的时刻。
根据中国工信部的官方消息,目前中国已成为全球开源参与者数量排名第二、增长速度最快的国家。此外,有数据显示,阿里通义开源模型的衍生模型数量已超10万个,成为全球最大的开源模型群体。
中国大模型的密集开源将产生怎样的影响呢?
中国科学院院士梅宏曾指出,未来的大语言模型需要像互联网一样走向开源,全球共同维护一个开放共享的基础模型,以确保与人类知识的同步。否则,任何机构所掌握的基础模型都难以让其他用户安心地上传应用数据,也就难以产生足够满足各行业需求的应用。
胡延平强调,以通义千问为代表的中国大模型正在抓住开源热潮,努力缩小与全球领先技术之间的差距。中国开源生态的成功为未来的发展储备了强大的动力。
阿里云的高级总监朱迅垚认为,大家逐渐意识到,开源模型将成为推动中国人工智能发展的强大引擎。接下来,建议从国家到地方再到企业,以更加积极的态度拥抱开源,同时加快在智能算力、构建高质量数据集和云端应用方面的创新步伐,以跟上全球先进水平。
有外媒报道指出,中国科技公司选择开源路径,不仅是为了与同行展开竞争,更是为了加速AI的采用与创新。开源模型降低了成本,为产品创新提供了新的机遇。这一趋势不仅促进了中国AI领域的快速发展,甚至可能缩短技术差距。(完)