资本狂热追逐ChatGPT,国内最新融资10亿引发热议!

共计 3989 个字符,预计需要花费 10 分钟才能阅读完成。

来源丨创业邦(ID:ichuangyebang)

作者丨巴里

编辑丨子钺

图源丨图虫创意

这几天,一个名为 ChatGPT 的聊天机器人彻底破圈了,火遍全网。

它写得了代码,修复得了 bug,还能帮你写工作周报、写小说、进行高考答题,甚至你还可以诱骗它规划如何毁灭人类。

尽管市面上已经有了大量的聊天机器人,但马斯克仍然对此感叹:“很多人疯狂地陷入了 ChatGPT 循环中,我们离强大到危险的人工智能不远了。”

这个看似无所不能的 ChatGPT 是由美国 OpenAI 开发的大规模预训练语言模型,马斯克曾是这家公司的创始人之一。

12 月 5 日,OpenAI 首席执行官 Sam Altman 在社交媒体上发文表示,ChatGPT 于上周三推出,截至目前已突破 100 万用户。

甚至免费公测版本的服务器很快就被热情的测试用户挤爆了。

联想集团副总裁、联想创投集团高级合伙人宋春雨告诉创业邦,AI 预训练大模型的出现,成为了近三年以来 AI 算法创新最受关注的投资机会。

睿兽分析显示,2022 年以来,国内大规模预训练模型赛道出现多笔大额融资,单笔融资金额高达 10 亿元,其中不乏联想创投、君联资本、启明创投、创新工场等知名投资机构。

被网友玩坏了的 ChatGPT 到底是什么?其背后的大规模预训练模型是怎样一条赛道,为何会受到众多投资机构的追捧?融资热背后,又离真正大规模商用落地还有多远?

AI 如何攻破人类,发人深省的回答

AI 教你怎么找男朋友

帮你写份周报应付老板

试一下 python 写个判断闰年,还有详细的解释,不过看上去像是在某个程序网站抄的

AI 是如何一本正经地胡说八道的

“新晋网红”ChatGPT 到底是什么?

简单来说,预训练模型(Pre-trained Model)是前人为了解决问题所创造出来的模型。后人在解决类似问题的时候,无需再从零开始训练一个新模型,而是可以利用此前在类似问题中训练过的模型来解决现有问题。

与人们熟悉的语音助手不同,ChatGPT 在与人们的对话中可以理解较为复杂的语句内容,比如有多层语法嵌套的句子。同时,ChatGPT 拥有一定联系上下文理解语境的能力,可以针对一个问题不断深入交流。令人惊讶的是,ChatGPT 既能承认错误、质疑不正确的前提,还能拒绝不恰当的请求。

这就意味着,ChatGPT 已经可以实现围绕某个话题,与人类展开一段谈话讨论的可能。

OpenAI 官方称,ChatGPT 是在人类的帮助下创建并训练的,人类训练师对该 AI 早期版本回答查询的方式进行排名和评级。然后,这些信息被反馈到系统中,系统会根据训练师的偏好来调整答案。这是一种训练人工智能的标准方法,被称为强化学习。

据国盛证券研报,ChatGPT 有着多达 1750 亿个模型参数,OpenAI 主要使用的公共爬虫数据集是有着超过万亿单词的人类语言数据集。

该研报指出,ChatGPT 在寻找答案、解决问题的效率上已经部分超越了如今的搜索引擎。ChatGPT 或许在未来会改变我们获取信息、输出内容的方式,AIGC(AI 生成内容)有望成为数字经济时代驱动需求爆发的杀手级应用。

不过,ChatGPT 也并非上知天文下知地理的“最强懂哥”。

据官网显示,ChatGPT 目前存在着一些局限性,包括有时会给出看上去正确但荒谬的答案、微调提问的方式会得到完全不同的答案、有时会反复使用某些句子等。

网友也发现,ChatGPT 有两个明显的缺点:输入不能有错,解释不够人性化。

所以,这个五天用户突破百万的模型突然遭到编程问答社区 Stack Overflow 的封禁。

目前,ChatGPT 的研究团队也表示将根据用户反馈持续改进模型,未来还有很长的道路要走。

尽管如此,OpenAI 依然被视为全球 AI 领域的顶级机构。

OpenAI 在 2020 年推出的上一代 GPT- 3 在当时就被称之为人工智能领域的一个重要里程碑。

在此之后,OpenAI 也开始尝试对 GPT- 3 进行商业化。目前,OpenAI 以 API 的形式向开发者客户有偿提供 GPT- 3 模型,并根据 token 使用量来收费。目前,基于 GPT- 3 产生的 App 已经达到 300 多个。

今年大火的 AI 绘画也与 OpenAI 密不可分。

最早,OpenAI 曾推出一款 DALL- E 低代码工具,用户只要提出想法、输入参数,电脑就会自动生成艺术级别的画作。在这一波 AI 绘画热潮中,还涌现了 Midjourney、Stable AI 等初创公司,有些公司已经成为独角兽。

正是预感到了大模型的巨大价值,在 GPT- 3 推出的前一年,也就是 2019 年,微软向 OpenAI 进行了高达 10 亿美元的投资。

这也为微软大力推进的云战略吸引来了不少客户。

例如,美国最大的汽车零售平台 CarMax 利用 OpenAI 的开发工具把 10 万条客户评论直接进行了分析,根据客户的表达情绪分类成正面、中性和负面,还提取了关键字摘要,对于公司的战略决策起到了很大的帮助。

CarMax 首席技术官甚至表示,如果没有人工智能,这项工作靠人工编辑团队需要耗费 11 年才能完成。

可以说,OpenAI 带给了人们巨大的想象空间。

融资火热背后,离真正大规模商用还有多远?

实际上,不仅是最近破圈的 ChatGPT,近两年国内也迎来了“大练模型”和“练大模型”的军备竞赛热潮。

其中,自然少不了行业巨头和高校科研机构。

百度发布了产业级知识增强大模型“文心”(参数规模达 2600 亿),并基于“文心”模型形成了产业全景图。同时,华为联合鹏程实验室等也发布了“盘古”大模型,阿里巴巴达摩院发布了中文语言模型 PLUG。

此外,由北京智源人工智能研究院牵头,汇聚清华、北大、人大、中科院和相关企业共同研发的超大规模预训练模型“悟道”(悟道 2.0 参数规模达 1.75 万亿)也于 2021 年亮相。

“AI 预训练大模型的出现,成为了近三年以来 AI 算法创新最受关注的投资机会。”联想集团副总裁、联想创投集团高级合伙人宋春雨表示,随着超大规模 AI 预训练模型的技术突破,在自然语言理解方面已经展现出超高程度的可用性,简而言之就是“机器真的懂人了”。

他认为,大规模预训练模型是 AI 大数据要走的必然之路。从学术界和产业界的角度来看,AI 和大数据技术的变化也会非常大。未来两年、最多三年,AI 将会有很大能力的提升。

回溯历史,从最早 Deep Learning 到 Alpha go,到 Zero 自训练,到 Transformer,再到 GPT-3,AI 在突飞猛进的发展,并不断落地在应用场景中,比如 AI 制药、预测化学分子都极大地提高了所在行业的生产力。

启明创投合伙人周志峰也表示,人工智能过去 10 年发展集中在感知智能,特别是视觉和语音技术的突破。下一个十年,人工智能将走向认知智能,预训练大模型是其核心技术推动力和关键基础设施,让 AI 吸收更多的知识去理解和思考,最终实现接近人类水平的认知。同时,预训练大模型使得 AI 从依赖手工调参建模走向可大规模复制的工业化阶段。

大规模预训练模型被投资人看好,也直接反映在了投融资的热度上。

睿兽分析显示,2022 年以来,尤其是下半年,大规模预训练模型领域出现了多笔大额融资。

2 月 10 日,澜舟科技完成近亿元 Pre- A 轮融资,由联想创投、斯道资本共同领投,创新工场跟投。9 月 26 日,智谱 AI 宣布获得数亿元 B 轮融资,由君联资本和启明创投联合领投。11 月 7 日,小冰公司宣布完成 10 亿元新融资。12 月 6 日,聆心智能完成数千万元天使 + 轮融资,由连星资本领投,图灵创投和智谱 AI 跟投。

这些企业均将商业落地作为融资后的发力重点,但其落地的侧重点各有不同。

澜舟科技研发的“孟子”模型,用更小的模型规模(10 亿参数量)实现了比肩超大模型的性能,能够具备灵活的领域和场景适应能力,在机器翻译、文本生成、行业搜索等场景更利于快速、低成本地落地。

2021 年 9 月,澜舟科技和传神合作的第一个基于孟子预训练模型的“任度”翻译引擎正式发布上线,截至目前澜舟科技已完成了各行业垂直领域 20 余个翻译模型的开发,覆盖新闻、金融、汽车等领域。

聆心智能目前则主要侧重于游戏、营销、情感三个领域。

聆心智能在 12 月推出了图灵世界的首个产品“AI 乌托邦”,用户可快速定制 AI 角色,只需要输入简单的角色描述,就可以召唤出相应人设的 AI,与之进行深度对话,还可以命令 AI 完成相应的任务。

此外,聆心智能还打造了 Emohaa 情绪疗愈机器人,并与精神心理平台好心情达成合作,落地了国内首款人工智能心理陪伴数字人;还与高端豪华电动车品牌 Beyonca 合作,打造了新一代智能驾舱助手。

新一轮融资公布当天,小冰公司启动了对旗下人工智能数字员工(AI Being Employee)产品线的年度升级,其中之一就是加强大模型对话引擎。

AI 小冰

据悉,目前小冰框架中运行了 30 万名数字员工,包括万科集团年度优秀员工“崔筱盼”、红杉中国首位虚拟分析师“Hóng”、虚拟歌手“洛天依”等。由小冰框架生成的“小堂妹”等数名虚拟主播,全网播放量均已破亿。

尽管各家的“大炼模型”已经在商业落地上取得了一些成绩,但实际应用情况如何、能解决哪些实际问题仍然在遭受着用户的质疑。

平安科技前沿技术部门负责人王磊就曾公开指出,当前大规模预训练模型在垂直领域存在“致命”问题。

他认为,大规模预训练模型在垂直领域性能达不到要求的原因可能是:大规模预训练模型的训练语料库规模很大,既包含了该领域的关键信息也包含了其他无关信息,使得模型缺少对关键信息的关注。同时,当前大规模预训练模型的机制改进也很少涉及对关键信息的提取。

不同于网友在 ChatGPT 上的“自娱自乐”,大规模预训练模型一旦商用,假如出现错误,或将会造成难以挽回的实际损失。这也是客户最大的担心之处。

特别是金融行业的客户对上线模型的精度要求很高,不少场景直接使用预加载模型往往很难满足需求。

有投资人也表示,“尽管可以通过置信度评估方法等方式来提升模型的靠谱程度,但距离商用真正意义上的‘好用’仍有很长一段路要走。”

正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-09-21发表,共计3989字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
评论(没有评论)
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!