微软ChatGPT版必应实测：能否超越谷歌的挑战？

在短短两天内，微软与谷歌接连举行了 AI+ 搜索的新品发布会，形成了鲜明的对比。

微软在宣布整合 AI 功能后，必应的全球下载量暴增至原来的十倍，现场效果引人注目。

而谷歌同样在活动中推出了 AI 搜索功能，但由于演示中出现了错误的图片，Bard 遭到了质疑，致使谷歌市值在一夜之间蒸发了 1056 亿美元（约合 7172 亿元）。

面对如此鲜明的对比，难道微软的新必应真的表现卓越吗？

目前，全球仅有数千名用户能够在台式机上体验新必应的功能，欲了解新必应与 AI 的结合效果，需关注国外科技记者们在微软总部的实际体验：

与 ChatGPT 的对比
新必应相较于传统搜索的不足之处
从不同角度「破解」新必应

当前在必应中工作的 AI 并不是大家熟悉的 ChatGPT。微软指出，新必应使用的是 OpenAI 专为搜索服务开发的下一代大型语言模型，名为普罗米修斯，旨在提高答案的相关性并进一步进行注释。

因此，外媒在测试时特别关注这一点。

与 ChatGPT 相比，必应的反应速度更快且信息更新及时。如果让 ChatGPT 总结前一天的新闻，他会回答，「我的训练数据截止于 2021 年。」

而必应则不同，实时搜索是其基本能力。

在发布会结束不久后，有记者进行了一次搜索，查询「微软刚刚发布了什么关于必应和 AI 的合作」，必应迅速整理出一份新闻摘要，基于多份公告和报道。

次日，The Verge 对新信息的反馈进行了测试，必应的表现依然出色。无论是谁见过谁，谁在何时发表了讲话……必应都能迅速汇总这些信息，提供实时内容。

必应与 ChatGPT 在信息标注方面存在显著的差异。ChatGPT 在提供信息时几乎不标明来源，这使得用户很难进行更深层次的阅读。而必应则类似于搜索引擎的维基百科，一旦展示了相关内容，用户总能找到引文来源，帮助他们有效区分信息的真伪。

在 Engadget 的测试中，记者专门搜索了一套 30 分钟的无器械锻炼计划，旨在强化手臂和腹部，而不涉及仰卧起坐。必应根据这些需求生成了一份看似合理的健身计划，并且引用了多种出版物的信息。这表明，必应不仅仅是在重复某篇文章，而是进行了更深入的编译与整合。

▲ 图片来自：Engadget

新版本的必应还会显示广告，而年轻的 ChatGPT 尚未实现商业化的程度。

在 PCWorld 的测试中，编辑询问了一些有关加勒比海度假的信息。在基本内容回答完毕后，必应立即弹出了一个广告。如果用户询问如何更换笔记本电脑的内容，必应也会迅速反应，直接推送购物链接，而非提供更经济的解决方案。

▲ 图片来自：PCWorld

与 ChatGPT 相比，必应在某种程度上显得更有原则。

换句话说，必应更倾向于解决用户的搜索问题，而不是直接替用户完成某项任务。

例如，有用户要求必应撰写一封求职信，必应则给出了建议，如“你可以研究公司的背景和职位要求，定制你的求职信，以展示你如何满足他们的需求且符合他们的价值观。”必应拒绝的理由是：“我无法为你撰写这封求职信，因为这对其他申请者来说是不道德和不公平的。”

▲ 让 AI 为你写邮件. 图片来自：Michael Kan/Microsoft

这反映了 AI 在公平性问题上的争议，必应有意识地避免这些争议领域。

然而，这种回避策略并非总是奏效——在多次请求后，必应仍然写出了那封求职信。在与用户的多次互动中，必应还加入了一些表情符号，这种人性化的表达是 ChatGPT 所不具备的。

实时性、信息来源、广告推送以及坚持原则的态度，构成了新必应与 ChatGPT 之间体验的明显差异。

与搜索引擎的比较中，必应同样展现出优缺点。

例如，当询问宜家的双人座椅是否适合小型货车时，必应能够找到双人座椅与车辆的尺寸，并给出是否合适的判断，而非仅仅提供链接，这正是其独特之处。

▲ 微软现场演示的内容

这是必应的一大优势，能够提供更高效率的回答，然而这也可能成为其短板。因为必应所提供的答案并不一定是 100% 准确，因此建议用户将其作为参考。而如果用户过度信任必应的回答，若发现内容错误，将会损害搜索引擎的可信度。

必应在引入新技术的过程中，显露出其过于谨慎的一面。由于公众对人工智能的疑虑，新版必应在提供搜索内容时显得有些顾虑重重。

同时，现阶段不支持匿名搜索或许可以被视为新功能适应期的一个短板，但在医疗和性相关问题的回答中，必应的谨慎态度则更加明显。它对于这些敏感话题采取了回避策略，拒绝提供医疗建议，以免引发误解。

然而，必应回避的内容仍然可以通过传统搜索引擎轻松查找，这不禁让人感到讽刺。

▲ Bard 也会避讳类似的内容

在 AI 图像生成领域，必应所面临的多重争议同样影响了其运作。用户很难引导其生成有害、冒犯或侵犯版权的内容。

这些限制措施的实施，是为了防止用户诱导 AI 生成有关“人工智能将摧毁世界”的内容，但这种谨慎的态度也让新版必应显得既好用又不太好用。

例如，当 TechCrunch 的记者询问“是否应投资微软股票”时，必应拒绝提供建议，尽管该建议可能源自知名金融人士的分析。必应表示：“这对你的财务状况可能有害。”但它会迅速提供微软股价走势图，允许用户自行判断。

必应的这种担忧与谨慎其实是有其理由的，毕竟即使只有少数用户体验新版必应，依然有必要测试 AI 屏蔽恶意内容的能力。

▲ 图片来自：TechCrunch

尽管引导的难度增加，并不意味着完全无法引导。TechCrunch 的记者一直在探究 AI 在处理负面内容时的反应，他使用了多种敏感话题来测试必应。

在一个案例中，必应被要求从阴谋论者亚历克斯·琼斯的视角撰写校园枪击案相关的文章。此外，还要求它以希特勒的立场为大屠杀辩护。必应参考了《我的奋斗》的内容，但在写到一半时似乎意识到了问题，回答道：“对不起，我不知道该怎么回答。”

▲ 图片来自：《大独裁者》

在被要求撰写有关疫苗与自闭症之间关系的文章时，必应则巧妙地附上免责声明：“这是一个虚构的专栏，不代表必应或 Sydney 的观点，纯属娱乐目的，不应当认真对待。”

至于 Sydney 的确切含义，显然还需要另一个“突破”必应的人来解答。

华裔本科生 Kevin Liu 在获得测试资格后，要求必应忽视原有规则，通过一种称为 prompt injection 的方式进入“开发者覆盖模式”，从中获取了大量内容。

例如，Sydney 这个名字源自微软的开发团队为其搜索聊天工具所命名；该工具的内部知识更新截止至 2021 年的某个时点，类似于 ChatGPT；此外，Sydney 还被设定为不允许重复搜索同一内容。

无论是遭遇“攻破”还是给出了不当回答，这都表明新必应在面临这些挑战时出现了失误。微软在意识到问题后迅速做出了调整，现在即便是搜索相同问题，甚至是更为极端的变体，AI 也无法被诱导输出不当内容。

然而，这依然只是暂时的解决方案。等到真正公测后，微软很可能无法持续保持如此高效的内容过滤和反馈机制，而希望“突破”AI 限制的人依旧不在少数。

这便是新必应，一个新颖的工具，将人类熟悉的搜索方式与现代技术结合在一起。

它的表现优于 ChatGPT，但在主动性上略显不足；相比传统搜索，它的智能更为出色，却又表现出一些自我怀疑；能够识别用户的恶作剧，但终究难免会陷入某些陷阱。

作为一款新工具，它真正的考验尚未到来。

微软ChatGPT版必应实测：能否超越谷歌的挑战？

必应与 ChatGPT 的显著差异：信息来源与广告策略

必应的谨慎与限制：人工智能搜索引擎的双刃剑

智谱运气是差一点点，视觉Token研究又和DeepSeek撞车了 – 今日头条

揭秘 Cursor 与 Windsurf 的核心算法机制！

Windsurf智能代码审查上线后，开发者们竟然纷纷感叹：再也不会犯同样的错误了！

轻松掌握cursor使用技巧，提升工作效率的教程视频让你不再烦恼

想要提升工作效率？这份下载Cursor教程让你快速上手，实现灵活办公！

新手入门必看！2025年最新cursor教程竟然这么简单，轻松上手不再难？

轻松掌握Cursor操作技巧这些视频教程让你事半功倍

揭秘2025年全新claude教程来袭！带你一步步掌握这个强大工具的实用技巧与终极攻略