共计 1417 个字符,预计需要花费 4 分钟才能阅读完成。
文章的核心围绕着数据(Data)与自动化(Automation)这两个问题展开。
实际上,自从大语言模型(LLM AI)问世以来,这两个基本问题就始终存在。而根本上,所有问题都归结为一个核心——”可验证性问题”。
① 数据:从“无”到“有”的潜力有限
自GPT-4推出以来,网络中的数据资源几乎耗尽,当前的主要任务是对旧数据进行再加工,类似于将“糙米精制成白米”,以提升模型的准确度。
从强化学习中获得的数据,例如数学和大部分编程代码,都是可以直接验证的。Dario Amodei在最近的采访中提到,他们也利用强化学习进行数据补充。越是能够定义真实问题的人,越容易生成高质量的数据。这些AI的半自动生成能力发展迅速,速度之快令人感到惊讶。如今,当我们谈论数学时,AIME几乎无人问津。那些专注于编程的AI公司之所以充满信心,正是因为“可验证性”给予了他们心理上的支持。
然而,对于翻译、写作、角色扮演等难以验证的领域,进展却相对缓慢,甚至有些领域的表现还不如早期的SOTA模型。这些问题目前基本被搁置。对于模型开发公司而言,每天都如同绷紧的弦,一季度90天,三个月一次小考,谁还顾得上这些呢?
不论是数学代码,还是翻译与写作,这些都是非物理交互数据,而模型仍然无法理解物理世界的运作方式。AGI的实现还有很长的路要走,许多大型模型公司尚未真正接触到这一领域。
② AI自动化:仍处于早期阶段
自动化的本质是所谓的智能应用(Agentic Applications),这同样涉及验证的难题。在日常工作中,我们经常需要确认自己的工作是否偏离了方向,汇报、征求、监督和开会成为了常态。
目前,能够交给智能代理(Agent)处理的任务多是普遍标准化、重复性高且易于验证的工作。基于现有语言模型的智能代理,仅仅是一个模式适配器,还不是一个拥有独立意识的实体。如果设想一个“智能代理的国度”,它一定是以生产经过验证的标准化产品和服务为主,强调能够完成工作,但不能承担责任。
我们社会的许多自动化流程都建立在标准化的基础上,无论是工业供应链还是数字供应链,目前似乎尚未为智能代理准备好一条标准化的AI供应链。以网站、应用程序和小程序为例,它们是否为智能代理提供了友好的独立通道?想到那些智能代理模仿人类动作操作电脑和手机,我不禁感到尴尬,这本应有更快捷、更精准的方法。AI真的能适应那些“为人类设计”的复杂网站吗?
③ 未来的未来:向上还是向下
现阶段的AI在一定程度上推动了社会财富的转移,但我们并不需要过多的代码、图片、视频和文字。这些数字内容的生产者本是支撑中产阶级的基石,而如今,随着AI的出现,这些产品的供给已远超需求,导致售价接近于电费加设备折旧费的水平。
要使AI发挥真正的价值,不能只是在中产阶级之间进行财富的掠夺,而应向上发展,投入研发,推动人类文明的进步;也要向下延伸,专注于物理AI,提升农业、矿业和电力行业的产出,让低产者的生活有所依托。我会因此给予高度的尊重。
