通义千问与文心一言大比拼:哪个才是苹果AI的最佳拍档?

共计 4077 个字符,预计需要花费 11 分钟才能阅读完成。

售价从4499元起的iPhone 16e已正式发布,但消费者在购买时需谨慎权衡。

单从硬件规格来看,与同价位的安卓手机相比,iPhone 16e的表现堪称优异。然而,对于苹果的忠实用户而言,这款AI iPhone以其最低的价格成为预算有限、希望体验苹果AI功能用户的理想选择。

去年10月,苹果曾宣布,Apple Intelligence将于2025年4月初推出其简体中文版。如今,iPhone 16e的商品页面再次显示,Apple Intelligence的上线时间将视监管部门的审批结果而定,表明该功能已经完成开发并递交审查,有望如之前所宣传的,和iOS 18.4一起在四月初推出。

(图片

为了确保Apple Intelligence符合国内的相关标准,苹果正在中国寻找合适的AI企业合作伙伴,以便为中国用户提供相应的AI功能。最初有传闻称豆包、百度等公司可能与苹果合作,但经过筛选,最终选择了阿里巴巴,放弃了百度。2月13日,阿里巴巴的联合创始人蔡崇信在阿联酋迪拜举行的2025年世界政府峰会上确认了与苹果的合作。

然而,科技媒体The Information报道称,苹果并未完全放弃百度,而是与阿里巴巴和百度两家公司同时展开合作,百度也将参与部分AI产品的研发,包括中文版Siri语音助手的升级及图片和文本的智能搜索。

百度、阿里巴巴与腾讯被称作中国互联网的三大巨头,合称“BAT”,在AI时代分别推出了文心一言、通义千问以及腾讯混元三款大模型。苹果同时与百度和阿里巴巴合作,令人联想到苹果曾经对供应商的严格筛选,只有最强大的供应商才能成为其供应链的一部分。那么,究竟是百度还是阿里更适合成为苹果在AI领域的“黄金搭档”?

阿里与百度,谁能成为苹果AI的最佳搭档?

在之前的AI大模型测试中,小雷对通义千问、文心一言、豆包、Kimi、DeepSeek等多个国产AI大模型进行了多次比较,当时由于文心4.0及更强大模型的收费服务,为了公平起见,小雷选择了免费的文心3.5大模型进行测试。

现在,百度宣布文心一言将于4月1日起提供免费服务,并于6月30日起开源模型。在免费服务推出之前,每天还会发放VIP体验券,几乎等同于免费。因此,小雷决定用文心一言最强的文心4.0 Turbo与通义千问屡获殊荣的Qwen 2.5模型进行比较。

鉴于阿里巴巴与百度与苹果的合作是为了向iPhone用户提供AI服务,小雷将此次测试的问题全部设定为在日常使用手机时可能遇到的问题或需要处理的事项。

常识问答:PC端的通义千问是否更优秀?

在AI测试项目中,常识问答通常被认为是最简单的,小雷原本以为这次测试不会显示出AI大模型之间的差异,结果却令他感到意外。

由于早已计划假期旅行,小雷向AI提出的第一个问题是“今年高速公路哪些时间是免费的”。通义千问未能提供所有免费时间段,仅告知了春节期间的免费开始与结束时间。小雷不甘心,询问了两次,结果得到的回答完全相同。而文心一言则列出了春节、清明、劳动节、国庆节四个假期的免费时间段,并附上了免费通用型车辆的标准。

(左:通义;右:文小言;图源:App截图)

值得注意的是,当小雷切换到PC端后,再次向通义千问询问该问题,竟然得到了正确答案。然而,当他第三次使用手机端的通义App询问该问题时,通义千问仍然给出了之前相同的错误答案。

(图源:通义千问截图)

从结果来看,通义千问在常识解答方面的能力与文心一言相当,只是其网页版和手机App似乎存在差异,手机端的三次回答均为错误,而PC端却成功回答正确。考虑到这一因素,接下来的测试将全部改为使用网页版的通义千问和文心一言。

工作效率提升:文心与通义各有千秋

针对一些较长的论文和文档,小雷总是没有时间从头到尾仔细阅读,幸好AI大模型基本上都具备内容总结的功能。在本轮测试中,小雷选择了清华大学新闻与传播学院、新媒体研究中心及元宇宙文化实验室联合推出的《DeepSeek:从入门到精通》文件,要求通义千问和百度为他分析总结DeepSeek的使用技巧。

通义千问对内容的总结分为六个部分,前四个部分分析了DeepSeek的领先性和应用场景,第五部分涉及清华大学的贡献,最后一部分展望未来。虽然每个部分的内容都极为简略,但可作为DeepSeek入门前了解基础知识的材料,然而与“精通”二字并无太大关联。

(图源:通义千问截图)

而文心一言的总结则分为12个小部分,内容同样简略,但并未忽视提示语的重要性和使用技巧部分,避免了对用户不具意义的清华大学贡献一栏。当然,文心一言的总结内容略胜一筹,如果说通义千问的总结只是一种大标题和简单介绍,那么文心一言的总结则更像是小标题加内容梗概,实质性内容依然相对稀少。

(图源:文心一言截图)

在当前的AI大模型内容总结中,常常存在表述冗长、重点模糊、缺乏实用性的普遍问题。面对数万字的文档,浓缩为几百字难免会遗漏大量信息,因此在利用AI进行长文档总结时,建议用户最好再对生成结果进行核对,结合原始文本进行审阅。

为了更深入地评估两款AI大模型的表现,小雷决定缩小测试范围,让大模型基于文档中的提示语链内容,撰写一篇关于提示语链的作用及其设计原则的文章。

在这次测试中,通义千问的表现有所改进,改变了以往的简洁风格,详细阐述了提示语链的功能、设计原则和模型,指导用户如何有效设计和使用提示语链。

(图源:通义千问截图)

与此相比,文心一言依然保持着简约的风格,对于机制的分析和设计原则的解析,令人感到似乎未能完全把握文档的深意。

(图源:文心一言截图)

在这轮评测中,文心一言在PDF全文解读方面稍显优势,而在提示语链的内容生成能力上,通义千问则表现更佳,两者各有千秋。苹果公司同时与阿里巴巴、百度展开合作,或许可以借此结合两者的优点,为用户带来更全面的AI体验。

360公司开发的纳米AI搜索应用,已提供混合模型方案,并联合15家大模型厂商共同打造AI助手,能智能调整大模型的答案。未来,其他公司或许也会借鉴这一模式,通过混合模型克服单一模型在某些领域的不足。

图片编辑:文心再胜一局

如今,AI摄影和修图功能已成为普遍的应用,很多手机制造商在新机发布时会强调这一功能。小雷也对通义千问和文心一言的图片编辑能力进行了测试,然而这次测试中出现了一些意外情况。

通义千问并不支持通过文字指令进行图像修改,尽管提供了许多智能体来处理图片,但这些智能体均无法上传图片,导致使用受限。而唯一可以上传图片的修图智能体AI扩图,仅能实现等比例缩放,并不能基于现有内容创造新元素。

(图源:通义千问截图)

相比之下,文心一言能够顺利满足小雷的要求,将图片背景从灰色的天空替换为湛蓝的天空和白云。然而,灯塔的主体却被重新绘制,失去了原有的形态,经过调整后呈现出一幅新的画面,虽然保留了主体特征。

(图源:文心一言截图)

为评估两款AI大模型的生成图像能力,小雷使用了“海边矗立着一座孤独的灯塔,唯有蓝天白云和海鸟与其相伴”作为描述,分别要求通义千问和文心一言生成一幅画。从图片质量的角度来看,文心一言生成的图像在意境、清晰度和美感等方面均优于通义千问,同时文心一言还提供了四张图供用户选择。

苹果智能:阿里与百度的双重保障?

在近期的几轮测试中,通义千问和文心一言各自展现了不同的优势。百度在图片生成与文档总结方面表现突出,通义千问则在提取要点和撰写文章上颇具优势。

由于模型架构及训练数据的不同,AI大模型之间自然会在某些领域展现出各自的强项。苹果与阿里巴巴和百度的合作,或许是为了充分挖掘这两家公司的优势,从而在不同场景中为用户提供一流的体验。

(图源:苹果)

中文版的Apple Intelligence与英文版之间可能存在显著的体验差异,究竟哪一版更具优势尚不清楚。结合阿里巴巴和百度的AI实力,Apple Intelligence的发展令人期待。

起价4499元的iPhone 16e虽然价格偏高,但128GB和256GB版本的售价均低于6000元,并可享受政府补贴,3999元和4999元即可入手。此外,各大电商平台很有可能推出相关优惠活动。与iPhone 16系列其他型号相比,这款手机不仅价格更具竞争力,还支持Apple Intelligence,是否能帮助苹果在销量上实现反转,关键在于其在中国市场推出的“AI大餐”的用户体验。

手机AI的飞速进化,苹果面临紧迫挑战

在苹果的AI发展缓慢之际,安卓和鸿蒙阵营的手机品牌在AI技术上却迅速进步。

在国际市场,联想(Moto)和三星凭借Google Gemini及运营商的支持,正在迅速崛起;而在国内市场,小米、华为、OPPO、vivo和荣耀等品牌已经完成了各自的AI化进程,其AI功能表现出色,甚至成为手机厂商竞争的新焦点。

春节后的DeepSeek迅速走红,绝大多数国产手机厂商(除了小米)都迅速接入了这一技术,这表明了安卓手机开放性的优势:未来无论是DeepSeek的新模型,还是更强大的AI模型,安卓手机都能够第一时间适配,确保不掉队。

然而,iPhone用户却只能耐心等待,因为苹果的封闭模式要求逐个合作,这使得iPhone用户在智能体验上可能存在滞后。实际上,在中国用户等待苹果智能的这段时间内,DeepSeek R1/V3、xAI Grok 3以及即将发布的开源免费百度文心4.5等技术已经纷纷问世,AI技术的发展可谓突飞猛进。苹果的智能产品是否能及时赶上进度,令人存疑。

对于中国用户而言,“苹果智能”依然是一个悬而未决的梦。从春节到现在,中国用户逐渐习惯了强大的DeepSeek及其在微信、百度等国产安卓手机中的AI服务,期待值也随之提升。苹果与阿里或百度合作推出的“苹果智能”能否满足用户的期待,仍需时间来验证。

来源:今日头条
原文标题: 通义千问与文心一言对比评测:谁才是苹果 AI 的“黄金搭档”?– 今日头条
声明:
文章来自网络收集后经过 ai 改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-10-04发表,共计4077字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!