共计 5162 个字符,预计需要花费 13 分钟才能阅读完成。
ChatGPT:颠覆传统的人工智能新纪元
自去年 11 月起,一款名为“ChatGPT”的聊天机器人在国际上迅速流行,到了今年 2 月,这一产品几乎每天都成为热搜的焦点。
在热烈的讨论中,许多人惊叹道:“《流浪地球 2》中不断自我学习、最终拥有自主思维的‘MOSS’,似乎离我们不再遥远。”
然而,也有一些人认为,ChatGPT 与大家熟悉的智能助手如 Siri、小爱同学和小度等没有根本区别,因此不值得过度关注。
网友们纷纷尝试让它作诗、撰写小说、撰写工作简报和朋友圈文案,甚至用它来编写代码和论文……那么,ChatGPT 究竟是什么样的产品?它为何能迅速走红?它具备哪些功能?是否会导致某些职业被取代?未来的发展方向又将如何?我们采访了行业专家及多位 ChatGPT 用户,试图解答这些疑惑。
“并非新鲜事物”的 ChatGPT
为何突然受到关注?
ChatGPT 的全名是“聊天生成预训练变换器”,由美国的 OpenAI 公司开发,能够进行问答、文本摘要生成、机器翻译、分类、代码生成和对话 AI 等多种功能。
截至今年 1 月,ChatGPT 在不到两个月的时间内,就吸引了超过 1 亿用户,创下了打破 TikTok 用九个月达成同样用户数的速度记录。
南开大学计算机学院副院长刘晓光表示,尽管 ChatGPT 进入公众视野的时间较短,但 OpenAI 的 GPT 系列产品在几年前就已经对业内产生了深远影响。从技术角度来看,ChatGPT 并不是新出现的东西。
“从 2016 到 2020 年,OpenAI 先后推出了 GPT 的多个版本,去年 11 月底发布的 ChatGPT 可以看作是 GPT-3.5。虽然大多数普通人最近才了解到‘GPT’这一依赖大数据的预训练模型,但早期的 GPT- 3 早已在计算机科学和行业中产生了重要影响。国内的一些互联网公司在这股热潮之前,便已拥有自己的预训练大模型项目。”
刘晓光认为,ChatGPT 之所以能够迅速走红,可能有以下几个原因:“首先,早期的 GPT 系列主要面向商业用户提供技术支持,而 ChatGPT 则直接面向大众,用户可以随意提问,并在几秒钟内获得回答,更多人能够直观地理解其功能;其次,它发布时恰逢国外大学的考试季,许多学生利用它进行论文写作和作业提交,ChatGPT 提供了相对完整的答案,解决了学生的实际需求,因此迅速积累了用户。当然,随着火热程度的提升,也不排除一些科技巨头和媒体的过度关注及炒作。”
“出色到令人惊讶”
ChatGPT 究竟突破了哪些难点?
去年 12 月,埃隆·马斯克曾公开表示 ChatGPT“出色到令人惊讶”,并认为强大的人工智能技术已不再遥远。微软的联合创始人比尔·盖茨在接受采访时也表示:“ChatGPT 将会改变我们的世界。”近日,京东集团副总裁何晓冬在接受媒体采访时指出:“ChatGPT 是第一款真正意义上的人工智能产品,犹如首款 iPhone,发布时便展现出高度的完整性、使用体验及平台潜力。”
那么,行业领军人物为何对 ChatGPT 给予如此高度评价?不少人对此表示困惑。有网友在网络上提问:“与 Siri、小爱同学和小度等智能助手相比,ChatGPT 究竟有什么特别之处?几年前的 AlphaGo 也曾引起广泛关注。”
刘晓光指出,在计算机领域的专业人士看来,ChatGPT 的问世所带来的影响,甚至超过了七年前 AlphaGo 与围棋世界冠军李世石之间的对弈。
“从 30 年前 IBM 的‘深蓝’电脑战胜国际象棋冠军卡斯帕罗夫,到几年前 AlphaGo 战胜围棋冠军,虽然算法和计算能力有显著差异,但本质上仍局限于‘计算机在固定场景下执行固定任务’的范畴,这正是计算机最擅长的。”刘晓光解释道,“而 ChatGPT 面对的是一个‘开放世界’——数以亿计的用户提出各种问题,完全无法预见。它需要根据具体情况,自行组织回答,这正是 AI 开发中的难点,而 ChatGPT 在许多情况下表现得非常出色。”
刘晓光进一步类比道:“如今的智能驾驶技术多应用于矿山、港口和工厂等特定环境,这种‘封闭世界’不会给 AI 带来过于复杂的问题。而在公共道路上实现智能驾驶则难度巨大,因为 AI 在面对开放和不可预测的环境时,其运作难度会指数级上升。”
他认为,从核心概念来看,ChatGPT 与 Siri、小爱同学等智能助手的本质上仍是语言模型,并没有颠覆性的创新。区别在于,ChatGPT 的模型规模大、训练数据量丰富,软硬件处理能力更强,而 Siri 及其他助手在学习能力和数据量上显然逊色,更可说存在质的差异。
“在学习能力和数据处理量方面的优势,使得 ChatGPT 能够拓宽其可处理问题的边界。研究者观察到,ChatGPT 展现出相当于接受过大学教育的一般本科生的知识水平。这与之前同类产品相比,差异显著,令人震惊。”
一场“挑战”ChatGPT 的热潮
围观机器人“一本正经地胡说八道”
值得一提的是,ChatGPT 在中文互联网爆火后,迅速引发了一场意想不到的热潮——用户们争相“调戏”它。
与苹果的智能助手 Siri 在遇到复杂问题时常常回答“对不起,我不太明白”不同,ChatGPT 展现出尽可能用自身逻辑组织语言、回答问题的倾向。即便面对一些看似搞笑的问题,它也会给出回答。这种“严肃强答”的表现引发了用户的极大兴趣。
有些“强答”显示出 ChatGPT 有时并未完全理解所回答的问题。例如,当被问“为什么房子不应建成实心的”时,ChatGPT 会从空气流通和通风系统等方面详细论述这样的房子对健康的危害,却似乎没有意识到这样的房子根本无法居住。
网友“调戏”ChatGPT 的问题(图片来自网络)
在专业知识方面的问答中,ChatGPT 同样闹出了不少笑话。B 站一位历史区的 UP 主向 ChatGPT 提问后得到的答案显示,ChatGPT 会混淆春秋战国时期的魏国、三国时期的曹魏,以及十六国期的北魏等概念。此外,ChatGPT 还会将“南朝宋”和“南宋”搞混。
ChatGPT 的“严肃胡说八道”(图片
这种情况的结果往往是答非所问。一位历史学博士告诉记者,虽然这些“严肃胡说八道”的回答令人发笑,但奇怪的是,它的回答在逻辑表达上却相当严谨,不像是随便从网上抄来的。“我看到有人使用 ChatGPT 询问一些学术问题,它所给出的答案甚至包含了引用的论文、论文号等细节,结果一查,这些‘参考文献’全是 ChatGPT 自己编造的,令人哭笑不得,真不知道它是如何得出这些答案的。”
刘晓光指出,讨论 ChatGPT“胡说八道”的原因时,必须提到目前此类产品存在的一个缺陷,即可解释性差——预训练大模型中的神经网络层数繁多,AI 通过深度学习自我构建复杂规则。人们往往只能看到 AI 针对问题输出的结果,因此无论答案正确与否,人们都很难解释 AI 为何得出该结果。
多位使用过 ChatGPT 的用户告诉记者,ChatGPT 的回答很少出现“语无伦次”的情况,但却时常会出现逻辑和事实错误。越是冷门的小众领域,这种错误愈发明显。
这种现象的产生,或与 ChatGPT 的学习和训练数据构成有关。“众所周知,一款产品使用的人越多,往往会变得更好,这因为用户的使用行为本身就是一种反馈机制,能够帮助产品自我改进。ChatGPT 也不例外,在集中问题领域,它有更多样本来进行学习和自我纠正;而在冷门知识领域,ChatGPT 则缺乏足够的数据进行深度学习,因而会出现“胡说一通”的现象。”刘晓光表示,最近他在使用 ChatGPT 时,询问常见问题或新闻事件,往往能获得较准确的答案,但一旦询问相对冷门的知识,ChatGPT 就会明显“放飞自我”。
由此引发的另一个议题是 ChatGPT 输出答案的可靠性——它所提供的结果是否正确,应该由谁来判断?如果无法判断,就无法进行有效的反馈。而众所周知,正确的反馈对产品的迭代至关重要。
另一方面,ChatGPT 所产生的大量“胡说八道”式的低质量内容,模糊了真假、经不起二次校验的内容广泛出现,这将削弱整个内容平台的公信力,使人们对 ChatGPT 及其同类产品的可靠性产生怀疑。
毕竟,在信息泛滥的社会中,人们往往更渴望“信息精准性”,而非“信息密度”。
“饭碗会被抢走”?
人们是否应该担忧?
ChatGPT 的出现引发了另一个更为严肃的话题:是否会有人的工作被 ChatGPT 取代?
自 AI 技术问世以来,这类讨论从未停止。但要回答这一问题,必须摒弃对 AI 技术的盲目崇拜与随意“调戏”的心态,严肃看待一个问题:ChatGPT 到底能做什么,或者说即将能做什么?
对此,ChatGPT 自己列出了聊天机器人、自动文本生成、自动翻译、情感分析、内容摘要、数据分析、虚拟助理等具体应用场景。实际上,在这些领域中,ChatGPT 已证明自己优于以往所有产品,甚至表现得更为出色。
刘晓光认为,从长远来看,技术进步将导致行业变革是必然的趋势。但是,新的技术会否引发就业冲击,以及具体产生何种影响,最终取决于技术落地的顺利程度。
“从目前来看,ChatGPT 在图片制作、文本生成、媒体内容生产、虚拟人服务、工作汇报、翻译、编程、搜索引擎等领域将造成显著冲击。就在 2 月 7 日,微软宣布推出支持 ChatGPT 的新版本人工智能搜索引擎必应(Bing)和 Edge 浏览器,这已显著改变了搜索引擎的竞争格局——毫无疑问,从‘逐条抓取数据’转变为‘直接为用户提供答案’,这显然更符合用户需求。我们可以看到,新技术的快速发展并非夸大其词。”刘晓光补充道。
内嵌了 ChatGPT 的 Bing 搜索,能够直接制定用户所需的训练计划
然而,刘晓光同时指出,尽管 ChatGPT 有诸多优势,但其回答仍时常显示不可靠:“就 ChatGPT 所呈现的文本而言,要将其应用于实际场景,依然需要人的指导、审核与验证。”
从社会分工的角度来看,面对 ChatGPT 的冲击,首当其冲的是那些重复性劳动和创造力较少的工作。而创造力,正是当前无论如何拼算力、烧财力也无法让 AI 轻易跨越的一道鸿沟。
“人类为何拥有创造力?至今尚无定论,更遑论将创造力灌输给机器。到目前为止,AI 最擅长的仍是‘按部就班’,本质上仍无法突破创造力这一障碍,ChatGPT 也不例外。”刘晓光表示,“如果某天 AI 突破了创造力的瓶颈,那么人们面临的将不仅仅是某些行业的就业问题——届时整个社会将经历巨大的变革。”
未来将走向何方?
早在 2015 年,科技领袖如奥特曼、彼得·泰尔、里德·霍夫曼和埃隆·马斯克等人创建 OpenAI 时,该公司还是一家非营利组织。创始人们希望避免人工智能技术的垄断,推动技术的开放与共享。
然而,随着项目的推进,训练机器学习模型所需的资金不断增加,OpenAI 开始设立营利性分支机构。2019 年,微软逐步介入,至今两者的财务和技术关系愈发紧密。今年 1 月,随着 ChatGPT 的火热,微软向 OpenAI 追加了 100 亿美元的投资。
目前,ChatGPT 依然处于免费试用阶段,但有关其即将推出收费版本的消息频频出现。同时,Bing 搜索已内嵌 ChatGPT,传闻微软可能将 ChatGPT 整合进 Office 办公软件中,这将为办公生态带来新的变革。
内嵌了 ChatGPT 的 Bing 搜索正在写诗
“预训练大模型”类软件将走向何方?业内人士认为,虽然 ChatGPT 的核心理论不算新颖,但开发类似产品所需的资金和人力已在某种程度上形成了新的门槛。
“早在前一代 GPT 中,仅模型训练一次的费用就高达数千万甚至上亿美元,十分昂贵。OpenAI 预计将在今年发布 GPT-4,这将是备受期待的升级,同时也意味着需要更多的数据和更强的计算能力,这些都需要大量的资金和人力。因此,开发类似产品的门槛正在不断提升。”刘晓光说道。
在这种趋势下,国内计算机行业面临着怎样的机遇与挑战?刘晓光认为,当前国内外企业在开发预训练大模型产品的核心理论上不存在太大差距,但在数据采集和分析处理能力上,“后来者”们仍需追赶。
“如果将机器学习和训练所需的数据比作食材,那么这些食材需要经过收集和处理才能变得适合吸收,这并非易事。无论是文本、图片还是视频,通常都需要人工标注,这不仅需要时间和人力的积累,也需要相应的资金投入。因此,业内普遍认为,数据是互联网公司的重要资产,甚至有人将数据比作企业的‘护城河’。”刘晓光总结道。
预训练大模型软件的未来发展方向或将指向三个特征:“一是数据量越来越大,计算能力不断增强,包罗万象;二是向专业化领域进军,在特定细分领域追求信息的极致精度,如医疗、法律、体育和编程等;三是与具体应用场景深度结合,不仅限于‘聊天’,而是与虚拟人表演、电商营销、售后服务、陪伴老幼等场景结合。ChatGPT 所展现的潜力,预示着它将在这些领域大有可为。”