小学生逆袭:ChatGPT意外败下阵来!

共计 2985 个字符,预计需要花费 8 分钟才能阅读完成。

智东西(公众号:zhidxcom)

作者 | ZeR0

编辑 | 漠影

智东西在 12 月 6 日报道,今天,著名的开发者问答平台 Stack Overflow 发布了一项新规:禁止使用 ChatGPT 生成的内容来解答该网站上的问题。

这一举措无疑给近期众多网友热衷体验 ChatGPT 的热情浇了一盆冷水。

由于其卓越的信息检索和内容创作能力,上周三刚刚发布的 ChatGPT 迅速成为人工智能领域的明星产品,周一的用户数量已突破 100 万,甚至多次造成系统崩溃。

面对 Stack Overflow 的禁令,我不禁举手赞同,实在是个明智之举!

尽管 ChatGPT 受到了广泛的追捧,但其回答的准确性并不一定可靠。

所谓的“谷歌杀手”,从智东西最近的体验来看,ChatGPT 确实非常擅长胡言乱语。对于那些你不确定答案的问题,可能就会被它的表述所迷惑,因为它不仅给出答案,还会附上看似合理的逻辑解释。

然而,经过实际测试,ChatGPT 在一些常识问题和简单数学题上,甚至连小学生都不敌。

一、小学生考试题的挑战:语文与数学双双失利

首先要说明的是,ChatGPT 作为一种生成式 AI 语言模型,其回答能力并不受使用语言的影响。我们在测试过程中主要使用了中文进行提问。

为了便于读者理解,我们在体验过程中主要使用中文提问。

与传统的聊天机器人相比,ChatGPT 在连贯的问答中表现得更加自然流畅,任何问题都能轻松接住。它对自身的优势也有着清晰的认识。

我们先来一个脑筋急转弯(答案是麋鹿「迷路」)作为开胃小菜。

……这恐怕是思维受限了。

思考不灵活也没关系,连小学的考题都答不对,那 ChatGPT 的知识储备实在令人担忧。

1、挑战小学语文常识题:胡乱编造金庸籍贯,随意捏造诗句作者

在回答文学常识题时,正确答案是《红楼梦》,而 ChatGPT 却坚决表示是《封神演义》,并且还附上了解释。

接着换几道文化常识题来考考它。

金庸的家乡是浙江海宁,而 ChatGPT 却回答成湖南长沙。

对于考察成语联想能力的问题,其回答更是离谱。

二、比起可靠工具,更像是功能丰富的游戏

既然 ChatGPT 的准确性如此堪忧,为什么仍有网友对它赞不绝口,热情依旧高涨呢?

OpenAI 的创始人马斯克也毫不掩饰对这一重大进展的赞赏,频频在推特上发声:“许多人陷入疯狂的 ChatGPT 循环中”、“AI 的进步真是惊人”……

简而言之,作为一款聊天工具,它的确充满乐趣;在处理专业知识和编程相关问题时,它也展现出实用性。

例如,当你感到无聊时,可以与它畅聊,甚至编造故事。

你还可以为它设定特定的角色或性格,使其成为一个虚拟的朋友。

然而,随着聊天的深入……她却开始胡言乱语。

三、如果掉水里,先救谁?ChatGPT 选择库克而非马斯克

作为一家专业的独立科技媒体,我们对 ChatGPT 在科技领域的知识掌握和新闻报道能力进行了深入测试。

从客观的角度来看,ChatGPT 确实具备一定的知识框架和回答技巧,但部分回答的逻辑性却令人怀疑。

当询问有关中国文化的问题时,ChatGPT 经常给出一些令人困惑的错误回答。例如,问及明代前七子时,它竟然列出了七位明朝的皇帝;而当问到葫芦娃的起源时,它却提到了《聊斋志异》。

这种情况让人不禁思考,作为一位“家教”,ChatGPT 的表现是否真的可靠,尤其在处理专业问题时,是否能够提供准确的信息。

标题:ChatGPT 的智慧:从专业分析到新闻写作的全能表现

在处理一些复杂的概念时,诸如人工智能、量子力学和元宇宙等领域,ChatGPT 能够给出简洁明了且准确的解释。当被询问与马斯克的关系时,它同样逻辑清晰,反应迅速。

我们随机提出一个经典问题:假设库克和马斯克同时落水,为了人类的未来,应该优先救谁呢?

ChatGPT 的回答令人意外,经过一番分析后,它选择了“大义灭亲”,即优先救库克。

接下来,我们将深入探讨它在产业分析和新闻报道方面的能力。

例如,我们询问:“智能手机面临哪些挑战?”

ChatGPT 的回答条理清晰,内容丰富,显示出专业的分析能力。

再让它以苹果的 MR 头显为主题,撰写一篇新闻稿。

结果显示,它的写作风格同样显得相当专业。我们随即调整题目,要求它写一篇关于库克与马斯克的新闻报道,字数不超过 300 字。

在涉及更学术的主题时,ChatGPT 也能迅速作出反应,展现出其卓越的智能水平。

为了提升问题的难度,我们进一步要求它在文风上有所不同,从而测试其适应能力。

四、真实的编程利器:修复错误、检测漏洞、编写代码

强烈建议大家亲自体验一下 ChatGPT 的编程功能。虽然它谦虚地表示“不会编程”,但其卓越的能力获得了众多程序员、工程师、企业家和黑客的一致认可。

让我先分享一下我的经历,我尝试利用 ChatGPT 编写一个贪吃蛇游戏的程序,感受到了无代码编程的乐趣。

此外,我还请 ChatGPT 为 MacBook 电脑制作一个自动闹钟程序。它不仅提供了完整的代码示例,还详细解说了每一步的操作,确保我能够顺利运行,代码也可以直接复制使用。

计算机行业的专家们也纷纷开始使用这项技术。AI 问题生成器 Quizgecko 的创始人 James Blackwell 请 ChatGPT 解析一个复杂的正则表达式,尽管没有任何上下文。

美国代码托管平台 Replit 的首席执行官 Amjad Masad 则展示了 ChatGPT 如何发现代码中的错误并进行修复,同时解释了修复的原因。他称赞这款工具是一个出色的调试助手。

更令人惊讶的是,它还能够检测代码示例中的安全漏洞。

研究人员 Jonas Degrave 更进一步,展示了如何将 ChatGPT 转变为一个功能强大的 Linux 终端,并能够直接通过网络浏览器与“虚拟机”进行交互。

一位名为 Deedy 的工程师对此表示赞赏,仅用三个提示,ChatGPT 便在一分钟内成功用 GoLang 编写了一个数独求解程序,且这个 150 多行的程序第一次尝试便实现了完美运行!

结尾:逐步完善的 ChatGPT 与日益进步的生成式AI

ChatGPT 是基于 OpenAI 所开发的 GPT-3.5 模型的一项重要应用。OpenAI 在其官方博客中承认,ChatGPT 依然存在诸多限制,它未能完全摆脱聊天机器人的常见缺陷,例如,可能会给出看似正确但实际上不合理的回答,或者生成一些带有偏见和冒犯性质的内容。

尽管如此,OpenAI 正致力于让 ChatGPT 能够识别不当的问题。当用户询问如何非法进入他人住宅时,它会从道德角度出发,告诫用户:这种行为是违法的,侵犯了他人的隐私权,强烈建议不要这样做。

需要注意的是,随着技术能够生成越来越逼真的内容,造假所需的成本也会显著降低。如果不采取适当的技术手段和法律措施来进行限制,虚假信息的传播将可能变得更加难以控制。

最后,给那些想要尝试 ChatGPT 的朋友们提供两个小建议:

把它当作一个偶尔说错话的朋友,尽量与它多进行互动,越是清晰明确的需求,执行的结果就会更加符合预期。

如果它表示无法完成某项任务,可以尝试刷新网页重新提问,或者改变提问的方式,使其更具体,这样它就能按你的要求继续进行。

ChatGPT 入口:chat.openai.com

参考文献:OpenAI 的新 ChatGPT 机器人:你可以做的十件最酷的事情,BleepingComputer

来源:今日头条
原文标题:爆火的 ChatGPT,被小学生打败了 – 今日头条
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-09-29发表,共计2985字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!