共计 593 个字符,预计需要花费 2 分钟才能阅读完成。
[视频内容] 本文包含视频内容
21世纪经济报道记者 董静怡 上海报道
在4月29日的凌晨,阿里巴巴正式发布了其新一代的通义千问模型Qwen3(简称千问3)。这一模型的参数量仅为DeepSeek-R1的三分之一,显著降低了成本,同时在性能上全面超越了R1和OpenAI-o1等全球领先的模型,成为全球最强的开源模型。
千问3是中国首个“混合推理模型”,它将“快思考”和“慢思考”两种能力融入同一模型中。对于简单的问题,它能够以低算力迅速给出答案;而在面对复杂的挑战时,则能够进行多步骤的深入推理,从而显著降低算力的消耗。
此外,千问3还提供多样化的模型版本,其中包括两款30B和235B的MoE模型,以及0.6B、1.7B、4B、8B、14B和32B等六款密集模型。
目前,阿里通义已开源超过200个模型,全球下载次数已超出3亿,千问的衍生模型数量也超过了10万个,已经超越了美国的Llama,成为全球首个开源模型的领导者。
更多内容请下载21财经APP
来源:今日头条
原文标题:新的大模型杀手来了!阿里开源新一代通义千问模型Qwen3,成本仅需DeepSeek-R1的1/3 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完

