共计 4044 个字符,预计需要花费 11 分钟才能阅读完成。

来源丨创业邦(ID:ichuangyebang)
作者丨巴里
编辑丨子钺
图源丨图虫创意
最近,一个名为 ChatGPT 的聊天机器人引起了广泛关注,迅速在网络上走红。
它不仅可以编写代码和修复 bug,还能够协助撰写工作周报、创作小说,甚至在高考中提供解答,甚至有人试图引导它规划如何消灭人类。
虽然市场上已有众多聊天机器人,但马斯克却对此表示:“许多人已经深陷于 ChatGPT 的世界,我们距离强大且潜在危险的人工智能并不遥远。”
这个看似无所不能的 ChatGPT,实际上是由美国的 OpenAI 开发的大规模预训练语言模型,而马斯克曾是这家公司创始团队的一员。
2022 年 12 月 5 日,OpenAI 的首席执行官 Sam Altman 在社交平台上发布消息,称 ChatGPT 于上周三正式上线,并在短短时间内用户数量已超过 100 万。
甚至免费测试版的服务器在短时间内就被热情的用户挤爆。
联想集团副总裁暨联想创投集团高级合伙人宋春雨对创业邦表示,AI 预训练大模型的崛起,已成为近三年来 AI 算法创新中最引人注目的投资机会。
根据睿兽分析,自 2022 年以来,国内的预训练模型领域已发生多起大额融资,单笔融资额高达 10 亿元,众多知名投资机构如联想创投、君联资本、启明创投等均参与其中。
那么,ChatGPT 究竟是什么样的存在?它背后的预训练模型领域为何受到如此多投资者的青睐? 在融资热潮的背后,我们距离真正的大规模商业应用还有多远呢?

AI 如何突破人类界限,令人深思的答案

AI 教你如何寻找伴侣

协助撰写周报以应对上司

深入探讨“新晋网红”ChatGPT 的奥秘
在简单的定义下,预训练模型(Pre-trained Model)是为了应对特定问题而设计的系统。这种模型的诞生,使得后续用户在面对类似挑战时,无需从头开始训练,而是能够借助于既有的经验进行高效解决。
与我们熟悉的语音助手相比,ChatGPT 的对话能力更为复杂,它能够理解富有层次的语法结构,进行深度交流。此外,ChatGPT 具备一定的上下文理解能力,能够围绕同一主题展开深入的对话。令人惊叹的是,这一系统不仅能识别自身的错误,甚至能质疑不合理的前提,并拒绝不当请求。
这表明,ChatGPT 能够与人类围绕特定话题进行有效的讨论,展现出强大的互动潜力。
OpenAI 的官方资料表明,ChatGPT 的开发和训练得益于人类的参与。早期阶段,人类训练师对 AI 的回复进行评估和排名,并将反馈信息输入系统,以此进行调整。这种方法被称为强化学习,是训练人工智能的常见手段。
根据国盛证券的研究报告,ChatGPT 的模型参数达到了惊人的 1750 亿个,所使用的数据集包含超过万亿单词的人类语言信息。
该报告指出,ChatGPT 在回答问题和解决困难时的效率已部分超越了现有的搜索引擎。未来,这一技术可能会革新我们获取信息和生成内容的方式,AIGC(AI 生成内容)有望成为数字经济时代的关键应用。
不过,ChatGPT 并不是无所不知的“超级智能”。
根据官方网站的信息,目前 ChatGPT 存在一些局限性,其中包括有时提供看似正确但实际上荒谬的答案、对问题表述的微调可能导致截然不同的结果,以及偶尔重复某些句子的现象。
许多用户也注意到,ChatGPT 存在两大明显缺陷:输入必须精准,且人性化的解释不足。
因此,这个在短短五天内就吸引了百万用户的模型,被编程问答社区 Stack Overflow 禁用。
目前,ChatGPT 的研发团队表示,将根据用户的反馈不断改进模型,未来的路依然漫长。
尽管如此,OpenAI 依然被认为是全球人工智能领域的佼佼者。
OpenAI 在 2020 年推出的上一代 GPT- 3 被视为人工智能发展史上的一个重要里程碑。
此后,OpenAI 开始尝试将 GPT- 3 商业化,现已通过 API 形式向开发者提供这一模型,并按照 token 的使用量进行收费。目前,基于 GPT- 3 开发的应用程序已超过 300 个。
当下备受关注的 AI 绘画也与 OpenAI 密切相关。
最初,OpenAI 推出了一款名为 DALL- E 的低代码工具,用户只需输入想法和参数,便能自动生成艺术作品。随着 AI 绘画热潮的兴起,Midjourney、Stable AI 等新兴公司也相继涌现,其中一些公司已成长为独角兽。
早在 2019 年,微软就意识到大模型的潜在价值,向 OpenAI 投资了高达 10 亿美元。
这一战略也为微软的云计算计划吸引了众多客户。
例如,美国最大的汽车零售商 CarMax 利用 OpenAI 的开发工具分析了 10 万条客户评论,根据客户情绪将其分为正面、中性和负面,并提取关键字摘要,这为公司的战略决策提供了大力支持。
CarMax 的首席技术官甚至表示,如果没有人工智能,依靠人工团队将需要 11 年才能完成这项工作。
可以说,OpenAI 为人们的未来创造了无限的可能性。


融资热潮背后,距离全面商用究竟还有多远?
事实上,不仅是最近走红的 ChatGPT,过去两年内国内也掀起了“大规模模型训练”的竞争热潮。
这一过程中,自然少不了行业领军企业和高校研究机构的参与。
例如,百度推出了产业级知识增强大模型“文心”,其参数规模高达 2600 亿,并且基于该模型构建了产业全景图。同时,华为与鹏程实验室等合作推出了“盘古”大模型,阿里巴巴的达摩院则发布了中文语言模型 PLUG。
此外,由北京智源人工智能研究院主导,联合清华、北大、人大、中科院及相关企业共同研发的超大规模预训练模型“悟道”(悟道 2.0 参数规模达 1.75 万亿)也在 2021 年首次亮相。
联想集团副总裁、联想创投集团高级合伙人宋春雨指出,AI 预训练大模型的诞生,成为了过去三年内最受关注的投资机遇。随着超大规模 AI 预训练模型技术的突破,其在自然语言理解方面展现出了极高的可用性,简单来说,就是“机器真正理解人类了”。
他认为,大规模预训练模型是 AI 与大数据结合的必然趋势。从学术界与产业界的角度来看,AI 和大数据技术的演变将会非常显著。预计在接下来的两到三年内,AI 的能力将获得显著提升。
回顾历史,从最初的深度学习到 Alpha Go,再到自我训练的 Zero,接着是 Transformer,以及 GPT-3,AI 技术的发展如同井喷,并不断在各类应用场景中落地,例如 AI 制药和化学分子的预测,这些都极大地提升了相关行业的生产力。
启明创投合伙人周志峰也表示,过去十年内,人工智能的发展主要集中在感知智能上,尤其是视觉和语音技术的突破。未来十年,人工智能将走向认知智能,预训练大模型将成为其核心技术和基础设施,使 AI 能够吸收更多知识,进行理解和思考,最终接近人类的认知水平。同时,预训练大模型将使得 AI 从依赖手工调参数的建模,转向可大规模复制的工业化阶段。
大规模预训练模型受到投资者的青睐,这一点在投融资热度中得到了直接体现。
根据睿兽分析,自 2022 年以来,特别是下半年,大规模预训练模型领域涌现出多起大额融资事件。
例如,2 月 10 日,澜舟科技完成了近亿元的 Pre- A 轮融资,由联想创投与斯道资本共同领投,创新工场参与跟投。9 月 26 日,智谱 AI 宣布获得数亿元的 B 轮融资,由君联资本与启明创投联合领投。11 月 7 日,小冰公司宣布完成 10 亿元的新一轮融资。12 月 6 日,聆心智能获得数千万元的天使 + 轮融资,由连星资本领投,图灵创投和智谱 AI 跟投。
这些企业在融资后均将商业落地作为主要目标,但其具体的落地方向却各有侧重。
澜舟科技研发的“孟子”模型,凭借更小的模型规模(10 亿参数),达到了与超大模型相媲美的性能,具备灵活适应各领域和场景的能力,在机器翻译、文本生成和行业搜索等方面能够更快、更低成本地实现落地。
2021 年 9 月,澜舟科技与传神合作推出的第一个基于孟子预训练模型的“任度”翻译引擎正式上线,截至目前,澜舟科技已成功开发出覆盖新闻、金融、汽车等行业的 20 余个垂直翻译模型。
聆心智能目前主要聚焦于游戏、营销和情感三个领域。
在 12 月,聆心智能推出了图灵世界的首款产品“AI 乌托邦”,用户只需输入简单的角色描述,即可快速定制出相应的人设 AI,并与之进行深度对话,甚至可以指令 AI 完成特定任务。
此外,聆心智能还开发了 Emohaa 情感疗愈机器人,并与心理健康平台好心情达成合作,推出了国内首款 AI 心理陪伴数字人;同时与高端豪华电动车品牌 Beyonca 合作,打造新一代智能驾驶舱助手。
在新一轮融资公布的当天,小冰公司启动了针对其人工智能数字员工(AI Being Employee)产品线的年度升级,其中包括加强大模型对话引擎的功能。

AI 小冰
据了解,目前小冰框架下已运行着 30 万名数字员工,包括万科集团的年度优秀员工“崔筱盼”、红杉中国的首位虚拟分析师“Hóng”、虚拟歌手“洛天依”等。通过小冰框架生成的虚拟主播“小堂妹”等,已在全网获得超过亿次播放。
尽管各家在“大规模模型”的商业应用上取得了一定成就,但实际应用的效果和能解决的问题仍然引发用户的质疑。
平安科技前沿技术部门的王磊曾公开强调,现今大规模预训练模型在特定领域面临着“致命”的问题。
他指出,这种模型在特定领域表现不佳的原因可能在于:虽然其训练语料库庞大,但不仅包含了该领域的重要信息,还混杂了大量无关的内容,导致模型对关键数据的关注度不足。此外,现阶段对大规模预训练模型机制的改进,几乎没有涉及到如何有效提取重要信息。
与网民在 ChatGPT 上的“乐趣”不同,一旦大规模预训练模型商业化,若发生错误,可能会带来无法弥补的损失,这也是客户们最为忌惮的地方。
尤其是在金融行业,客户对于模型上线后的准确性要求极高,很多场景仅依赖预加载模型往往难以满足实际需求。
一些投资者也提出,“尽管可以运用置信度评估等方法来增强模型的可靠性,但要实现真正意义上的‘好用’,仍需要走过漫长的道路。”

利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!