ChatGPT风靡网络，资本热潮下国内新融资10亿！

来源丨创业邦（ID：ichuangyebang）

作者丨巴里

编辑丨子钺

图源丨图虫创意

最近，一个名为 ChatGPT 的聊天机器人引起了广泛关注，迅速在网络上走红。

它不仅可以编写代码和修复 bug，还能够协助撰写工作周报、创作小说，甚至在高考中提供解答，甚至有人试图引导它规划如何消灭人类。

虽然市场上已有众多聊天机器人，但马斯克却对此表示：“许多人已经深陷于 ChatGPT 的世界，我们距离强大且潜在危险的人工智能并不遥远。”

这个看似无所不能的 ChatGPT，实际上是由美国的 OpenAI 开发的大规模预训练语言模型，而马斯克曾是这家公司创始团队的一员。

2022 年 12 月 5 日，OpenAI 的首席执行官 Sam Altman 在社交平台上发布消息，称 ChatGPT 于上周三正式上线，并在短短时间内用户数量已超过 100 万。

甚至免费测试版的服务器在短时间内就被热情的用户挤爆。

联想集团副总裁暨联想创投集团高级合伙人宋春雨对创业邦表示，AI 预训练大模型的崛起，已成为近三年来 AI 算法创新中最引人注目的投资机会。

根据睿兽分析，自 2022 年以来，国内的预训练模型领域已发生多起大额融资，单笔融资额高达 10 亿元，众多知名投资机构如联想创投、君联资本、启明创投等均参与其中。

那么，ChatGPT 究竟是什么样的存在？它背后的预训练模型领域为何受到如此多投资者的青睐? 在融资热潮的背后，我们距离真正的大规模商业应用还有多远呢？

AI 如何突破人类界限，令人深思的答案

AI 教你如何寻找伴侣

协助撰写周报以应对上司

在简单的定义下，预训练模型（Pre-trained Model）是为了应对特定问题而设计的系统。这种模型的诞生，使得后续用户在面对类似挑战时，无需从头开始训练，而是能够借助于既有的经验进行高效解决。

与我们熟悉的语音助手相比，ChatGPT 的对话能力更为复杂，它能够理解富有层次的语法结构，进行深度交流。此外，ChatGPT 具备一定的上下文理解能力，能够围绕同一主题展开深入的对话。令人惊叹的是，这一系统不仅能识别自身的错误，甚至能质疑不合理的前提，并拒绝不当请求。

这表明，ChatGPT 能够与人类围绕特定话题进行有效的讨论，展现出强大的互动潜力。

OpenAI 的官方资料表明，ChatGPT 的开发和训练得益于人类的参与。早期阶段，人类训练师对 AI 的回复进行评估和排名，并将反馈信息输入系统，以此进行调整。这种方法被称为强化学习，是训练人工智能的常见手段。

根据国盛证券的研究报告，ChatGPT 的模型参数达到了惊人的 1750 亿个，所使用的数据集包含超过万亿单词的人类语言信息。

该报告指出，ChatGPT 在回答问题和解决困难时的效率已部分超越了现有的搜索引擎。未来，这一技术可能会革新我们获取信息和生成内容的方式，AIGC（AI 生成内容）有望成为数字经济时代的关键应用。

不过，ChatGPT 并不是无所不知的“超级智能”。

根据官方网站的信息，目前 ChatGPT 存在一些局限性，其中包括有时提供看似正确但实际上荒谬的答案、对问题表述的微调可能导致截然不同的结果，以及偶尔重复某些句子的现象。

许多用户也注意到，ChatGPT 存在两大明显缺陷：输入必须精准，且人性化的解释不足。

因此，这个在短短五天内就吸引了百万用户的模型，被编程问答社区 Stack Overflow 禁用。

目前，ChatGPT 的研发团队表示，将根据用户的反馈不断改进模型，未来的路依然漫长。

尽管如此，OpenAI 依然被认为是全球人工智能领域的佼佼者。

OpenAI 在 2020 年推出的上一代 GPT- 3 被视为人工智能发展史上的一个重要里程碑。

此后，OpenAI 开始尝试将 GPT- 3 商业化，现已通过 API 形式向开发者提供这一模型，并按照 token 的使用量进行收费。目前，基于 GPT- 3 开发的应用程序已超过 300 个。

当下备受关注的 AI 绘画也与 OpenAI 密切相关。

最初，OpenAI 推出了一款名为 DALL- E 的低代码工具，用户只需输入想法和参数，便能自动生成艺术作品。随着 AI 绘画热潮的兴起，Midjourney、Stable AI 等新兴公司也相继涌现，其中一些公司已成长为独角兽。

早在 2019 年，微软就意识到大模型的潜在价值，向 OpenAI 投资了高达 10 亿美元。

这一战略也为微软的云计算计划吸引了众多客户。

例如，美国最大的汽车零售商 CarMax 利用 OpenAI 的开发工具分析了 10 万条客户评论，根据客户情绪将其分为正面、中性和负面，并提取关键字摘要，这为公司的战略决策提供了大力支持。

CarMax 的首席技术官甚至表示，如果没有人工智能，依靠人工团队将需要 11 年才能完成这项工作。

可以说，OpenAI 为人们的未来创造了无限的可能性。

融资热潮背后，距离全面商用究竟还有多远？

事实上，不仅是最近走红的 ChatGPT，过去两年内国内也掀起了“大规模模型训练”的竞争热潮。

这一过程中，自然少不了行业领军企业和高校研究机构的参与。

例如，百度推出了产业级知识增强大模型“文心”，其参数规模高达 2600 亿，并且基于该模型构建了产业全景图。同时，华为与鹏程实验室等合作推出了“盘古”大模型，阿里巴巴的达摩院则发布了中文语言模型 PLUG。

此外，由北京智源人工智能研究院主导，联合清华、北大、人大、中科院及相关企业共同研发的超大规模预训练模型“悟道”（悟道 2.0 参数规模达 1.75 万亿）也在 2021 年首次亮相。

联想集团副总裁、联想创投集团高级合伙人宋春雨指出，AI 预训练大模型的诞生，成为了过去三年内最受关注的投资机遇。随着超大规模 AI 预训练模型技术的突破，其在自然语言理解方面展现出了极高的可用性，简单来说，就是“机器真正理解人类了”。

他认为，大规模预训练模型是 AI 与大数据结合的必然趋势。从学术界与产业界的角度来看，AI 和大数据技术的演变将会非常显著。预计在接下来的两到三年内，AI 的能力将获得显著提升。

回顾历史，从最初的深度学习到 Alpha Go，再到自我训练的 Zero，接着是 Transformer，以及 GPT-3，AI 技术的发展如同井喷，并不断在各类应用场景中落地，例如 AI 制药和化学分子的预测，这些都极大地提升了相关行业的生产力。

启明创投合伙人周志峰也表示，过去十年内，人工智能的发展主要集中在感知智能上，尤其是视觉和语音技术的突破。未来十年，人工智能将走向认知智能，预训练大模型将成为其核心技术和基础设施，使 AI 能够吸收更多知识，进行理解和思考，最终接近人类的认知水平。同时，预训练大模型将使得 AI 从依赖手工调参数的建模，转向可大规模复制的工业化阶段。

大规模预训练模型受到投资者的青睐，这一点在投融资热度中得到了直接体现。

根据睿兽分析，自 2022 年以来，特别是下半年，大规模预训练模型领域涌现出多起大额融资事件。

例如，2 月 10 日，澜舟科技完成了近亿元的 Pre- A 轮融资，由联想创投与斯道资本共同领投，创新工场参与跟投。9 月 26 日，智谱 AI 宣布获得数亿元的 B 轮融资，由君联资本与启明创投联合领投。11 月 7 日，小冰公司宣布完成 10 亿元的新一轮融资。12 月 6 日，聆心智能获得数千万元的天使 + 轮融资，由连星资本领投，图灵创投和智谱 AI 跟投。

这些企业在融资后均将商业落地作为主要目标，但其具体的落地方向却各有侧重。

澜舟科技研发的“孟子”模型，凭借更小的模型规模（10 亿参数），达到了与超大模型相媲美的性能，具备灵活适应各领域和场景的能力，在机器翻译、文本生成和行业搜索等方面能够更快、更低成本地实现落地。

2021 年 9 月，澜舟科技与传神合作推出的第一个基于孟子预训练模型的“任度”翻译引擎正式上线，截至目前，澜舟科技已成功开发出覆盖新闻、金融、汽车等行业的 20 余个垂直翻译模型。

聆心智能目前主要聚焦于游戏、营销和情感三个领域。

在 12 月，聆心智能推出了图灵世界的首款产品“AI 乌托邦”，用户只需输入简单的角色描述，即可快速定制出相应的人设 AI，并与之进行深度对话，甚至可以指令 AI 完成特定任务。

此外，聆心智能还开发了 Emohaa 情感疗愈机器人，并与心理健康平台好心情达成合作，推出了国内首款 AI 心理陪伴数字人；同时与高端豪华电动车品牌 Beyonca 合作，打造新一代智能驾驶舱助手。

在新一轮融资公布的当天，小冰公司启动了针对其人工智能数字员工（AI Being Employee）产品线的年度升级，其中包括加强大模型对话引擎的功能。

AI 小冰

据了解，目前小冰框架下已运行着 30 万名数字员工，包括万科集团的年度优秀员工“崔筱盼”、红杉中国的首位虚拟分析师“Hóng”、虚拟歌手“洛天依”等。通过小冰框架生成的虚拟主播“小堂妹”等，已在全网获得超过亿次播放。

尽管各家在“大规模模型”的商业应用上取得了一定成就，但实际应用的效果和能解决的问题仍然引发用户的质疑。

大规模预训练模型在垂直领域面临的挑战与担忧

平安科技前沿技术部门的王磊曾公开强调，现今大规模预训练模型在特定领域面临着“致命”的问题。