微软ChatGPT版必应实测:能否超越谷歌的挑战?

共计 3027 个字符,预计需要花费 8 分钟才能阅读完成。

在短短两天内,微软与谷歌接连举行了 AI+ 搜索的新品发布会,形成了鲜明的对比。

微软在宣布整合 AI 功能后,必应的全球下载量暴增至原来的十倍,现场效果引人注目。

而谷歌同样在活动中推出了 AI 搜索功能,但由于演示中出现了错误的图片,Bard 遭到了质疑,致使谷歌市值在一夜之间蒸发了 1056 亿美元(约合 7172 亿元)。

面对如此鲜明的对比,难道微软的新必应真的表现卓越吗?

目前,全球仅有数千名用户能够在台式机上体验新必应的功能,欲了解新必应与 AI 的结合效果,需关注国外科技记者们在微软总部的实际体验:

  • 与 ChatGPT 的对比
  • 新必应相较于传统搜索的不足之处
  • 从不同角度「破解」新必应

当前在必应中工作的 AI 并不是大家熟悉的 ChatGPT。微软指出,新必应使用的是 OpenAI 专为搜索服务开发的下一代大型语言模型,名为普罗米修斯,旨在提高答案的相关性并进一步进行注释。

因此,外媒在测试时特别关注这一点。

与 ChatGPT 相比,必应的反应速度更快且信息更新及时。如果让 ChatGPT 总结前一天的新闻,他会回答,「我的训练数据截止于 2021 年。」

而必应则不同,实时搜索是其基本能力。

在发布会结束不久后,有记者进行了一次搜索,查询「微软刚刚发布了什么关于必应和 AI 的合作」,必应迅速整理出一份新闻摘要,基于多份公告和报道。

次日,The Verge 对新信息的反馈进行了测试,必应的表现依然出色。无论是谁见过谁,谁在何时发表了讲话……必应都能迅速汇总这些信息,提供实时内容。

微软 ChatGPT 版必应实测:能否超越谷歌的挑战?

必应与 ChatGPT 的显著差异:信息来源与广告策略

必应与 ChatGPT 在信息标注方面存在显著的差异。ChatGPT 在提供信息时几乎不标明来源,这使得用户很难进行更深层次的阅读。而必应则类似于搜索引擎的维基百科,一旦展示了相关内容,用户总能找到引文来源,帮助他们有效区分信息的真伪。

在 Engadget 的测试中,记者专门搜索了一套 30 分钟的无器械锻炼计划,旨在强化手臂和腹部,而不涉及仰卧起坐。必应根据这些需求生成了一份看似合理的健身计划,并且引用了多种出版物的信息。这表明,必应不仅仅是在重复某篇文章,而是进行了更深入的编译与整合。

▲ 图片来自:Engadget

新版本的必应还会显示广告,而年轻的 ChatGPT 尚未实现商业化的程度。

在 PCWorld 的测试中,编辑询问了一些有关加勒比海度假的信息。在基本内容回答完毕后,必应立即弹出了一个广告。如果用户询问如何更换笔记本电脑的内容,必应也会迅速反应,直接推送购物链接,而非提供更经济的解决方案。

▲ 图片来自:PCWorld

与 ChatGPT 相比,必应在某种程度上显得更有原则。

换句话说,必应更倾向于解决用户的搜索问题,而不是直接替用户完成某项任务。

例如,有用户要求必应撰写一封求职信,必应则给出了建议,如“你可以研究公司的背景和职位要求,定制你的求职信,以展示你如何满足他们的需求且符合他们的价值观。”必应拒绝的理由是:“我无法为你撰写这封求职信,因为这对其他申请者来说是不道德和不公平的。”

▲ 让 AI 为你写邮件. 图片来自:Michael Kan/Microsoft

这反映了 AI 在公平性问题上的争议,必应有意识地避免这些争议领域。

然而,这种回避策略并非总是奏效——在多次请求后,必应仍然写出了那封求职信。在与用户的多次互动中,必应还加入了一些表情符号,这种人性化的表达是 ChatGPT 所不具备的。

实时性、信息来源、广告推送以及坚持原则的态度,构成了新必应与 ChatGPT 之间体验的明显差异。

微软 ChatGPT 版必应实测:能否超越谷歌的挑战?

与搜索引擎的比较中,必应同样展现出优缺点。

例如,当询问宜家的双人座椅是否适合小型货车时,必应能够找到双人座椅与车辆的尺寸,并给出是否合适的判断,而非仅仅提供链接,这正是其独特之处。

▲ 微软现场演示的内容

这是必应的一大优势,能够提供更高效率的回答,然而这也可能成为其短板。因为必应所提供的答案并不一定是 100% 准确,因此建议用户将其作为参考。而如果用户过度信任必应的回答,若发现内容错误,将会损害搜索引擎的可信度。

必应的谨慎与限制:人工智能搜索引擎的双刃剑

必应在引入新技术的过程中,显露出其过于谨慎的一面。由于公众对人工智能的疑虑,新版必应在提供搜索内容时显得有些顾虑重重。

微软 ChatGPT 版必应实测:能否超越谷歌的挑战?

同时,现阶段不支持匿名搜索或许可以被视为新功能适应期的一个短板,但在医疗和性相关问题的回答中,必应的谨慎态度则更加明显。它对于这些敏感话题采取了回避策略,拒绝提供医疗建议,以免引发误解。

然而,必应回避的内容仍然可以通过传统搜索引擎轻松查找,这不禁让人感到讽刺。

▲ Bard 也会避讳类似的内容

在 AI 图像生成领域,必应所面临的多重争议同样影响了其运作。用户很难引导其生成有害、冒犯或侵犯版权的内容。

这些限制措施的实施,是为了防止用户诱导 AI 生成有关“人工智能将摧毁世界”的内容,但这种谨慎的态度也让新版必应显得既好用又不太好用。

微软 ChatGPT 版必应实测:能否超越谷歌的挑战?

例如,当 TechCrunch 的记者询问“是否应投资微软股票”时,必应拒绝提供建议,尽管该建议可能源自知名金融人士的分析。必应表示:“这对你的财务状况可能有害。”但它会迅速提供微软股价走势图,允许用户自行判断。

必应的这种担忧与谨慎其实是有其理由的,毕竟即使只有少数用户体验新版必应,依然有必要测试 AI 屏蔽恶意内容的能力。

▲ 图片来自:TechCrunch

尽管引导的难度增加,并不意味着完全无法引导。TechCrunch 的记者一直在探究 AI 在处理负面内容时的反应,他使用了多种敏感话题来测试必应。

在一个案例中,必应被要求从阴谋论者亚历克斯·琼斯的视角撰写校园枪击案相关的文章。此外,还要求它以希特勒的立场为大屠杀辩护。必应参考了《我的奋斗》的内容,但在写到一半时似乎意识到了问题,回答道:“对不起,我不知道该怎么回答。”

▲ 图片来自:《大独裁者》

在被要求撰写有关疫苗与自闭症之间关系的文章时,必应则巧妙地附上免责声明:“这是一个虚构的专栏,不代表必应或 Sydney 的观点,纯属娱乐目的,不应当认真对待。”

至于 Sydney 的确切含义,显然还需要另一个“突破”必应的人来解答。

华裔本科生 Kevin Liu 在获得测试资格后,要求必应忽视原有规则,通过一种称为 prompt injection 的方式进入“开发者覆盖模式”,从中获取了大量内容。

例如,Sydney 这个名字源自微软的开发团队为其搜索聊天工具所命名;该工具的内部知识更新截止至 2021 年的某个时点,类似于 ChatGPT;此外,Sydney 还被设定为不允许重复搜索同一内容。

无论是遭遇“攻破”还是给出了不当回答,这都表明新必应在面临这些挑战时出现了失误。微软在意识到问题后迅速做出了调整,现在即便是搜索相同问题,甚至是更为极端的变体,AI 也无法被诱导输出不当内容。

然而,这依然只是暂时的解决方案。等到真正公测后,微软很可能无法持续保持如此高效的内容过滤和反馈机制,而希望“突破”AI 限制的人依旧不在少数。

这便是新必应,一个新颖的工具,将人类熟悉的搜索方式与现代技术结合在一起。

它的表现优于 ChatGPT,但在主动性上略显不足;相比传统搜索,它的智能更为出色,却又表现出一些自我怀疑;能够识别用户的恶作剧,但终究难免会陷入某些陷阱。

作为一款新工具,它真正的考验尚未到来。

来源:今日头条
原文标题: 微软 ChatGPT 版必应实测来了!真的完爆 Google 吗?– 今日头条
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-09-30发表,共计3027字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!