共计 11161 个字符,预计需要花费 28 分钟才能阅读完成。

雷递网 乐天 11 月 12 日
在今天的百度世界 2024 大会上,百度的首席执行官李彦宏透露,文心大模型的日均调用量已突破 15 亿次。这一成就得益于文心大模型的持续升级与优化,持续降低成本并提升效率。
李彦宏指出,过去两年间,大模型在消除幻觉方面取得了显著进展,其回答问题的准确性大幅提高。这使得人工智能不再是“一本正经的胡说八道”,而成为了一个值得信赖的工具。
他还提到,AI 应用的两个主要方向分别是智能体与产业应用。他认为,智能体即将成为 AI 应用的主流形式,并将在不久的将来迎来爆发。
以下是李彦宏演讲的完整内容:
尊敬的各位来宾,感谢大家参加百度世界 2024 大会!我们每年都借此机会向大家展示过去一年里在技术创新方面取得的最新成果。今年的大会主题是“应用来了”,这反映了我们对当前大模型和生成式 AI 的理解与展望。
过去两年,大模型的发展取得了显著成就,技术迭代与创新的速度前所未有。从大型企业到创业者,再到风险投资者,大家都在积极寻求基于大模型的超级应用。我们可以看到,这张来自第三方研究机构的全球 AI 全景图,清晰展现了大模型与生成式 AI 在迅猛发展中的层层叠加的趋势。
最初是 OpenAI 推出了 ChatGPT,接着百度发布了文心一言,随后谷歌推出了 Bard(现已更名为 Gemini)。此后,以英伟达和微软为代表的芯片及云计算公司也从中受益,紧接着开源模型也迅速跟进。与此同时,众多应用层创业公司获得了投资,传统软件企业也开始利用 AI 进行产品重构。
然而,客观来看,大家期待的超级应用尚未出现,甚至有人开始质疑,在过去 24 个月中,这场全球性的大模型热潮究竟是一次技术革命,还是又一轮泡沫?
作为中国人工智能领域的先锋,我们有责任来探讨这个关键问题。请看这张图表,它展示了文心大模型的每日调用量变化,截至目前,这一数字已超过 15 亿。如此陡峭的增长曲线,恰恰代表了过去 18 个月中中国大模型应用的迅猛发展。
坦率地说,这样的增长速度超出了我的预期。今年 5 月,也就是六个月前,当我们的人均调用量达到两亿时,我与我的高管们就大模型的未来展开了深入讨论。我当时认为,如果在未来一年内,API 调用量能从 2 亿提升至 20 亿,也就是增长十倍,那将意味着市场的真实需求。然而,仅仅半年过去,我们就已接近这一目标,显示出强劲的增长势头。
如此迅猛的调用量增长,背后是文心大模型在持续优化、降本提速的努力,同时也体现了我们紧贴客户需求,迅速发现和解决问题的能力。去年三月,文心一言发布时,我们曾指出百度大模型的特点在于知识和检索能力的增强。随着时间推移,我们意识到,检索增强并非仅仅是百度的特色,而是整个行业的共识。这种技术手段在英文中被称为 RAG,即检索增强生成。
作为一家以搜索起家的企业,我们在这方面理应做得尤为出色。采用这种手段的意义何在呢?它大大减少了大模型的幻觉现象。如果希望基于大模型开发出实际应用,消减幻觉是至关重要的。若模型经常产生错误信息,便不会有人信任,从而无法形成实际应用。有人提到利用模型创作小说,认为一些幻觉可能增加趣味性,但我认为即便是文学创作,也需要保持前后故事的一致性,否则就无法称之为智能,反而显得无能。
因此,如果你问我,在过去的 24 个月中,行业最大的变化是什么,我的回答将是:大模型基本消除了幻觉,其回答的准确性显著提升。这使得人工智能从“胡说八道”的状态,变得更加可靠。尽管我们知道大模型是基于概率生成内容,并且存在不确定性,但通过采用 RAG 技术,大模型能够利用检索到的信息来指导文本或答案的生成,极大提升了内容的质量和准确度。
如今,在文本层面的 RAG 已经取得了显著成果,但在图像等多模态内容的结合上仍显不足。请看这张图,这是我们用开源模型生成的北京天坛的图像,虽然看起来有些相似,但总觉得哪里不对劲。
我来告诉大家,真正的天坛是三层结构,而模型生成的却是四层,这是文生图中常见的幻觉现象。这种幻觉问题依旧普遍存在,因此当今的多模态大模型尚未有大规模应用出现。幻觉现象的问题尚未得到有效解决,至少没有达到文本生成中 RAG 所带来的效果。
今年年初,我们决定要着手解决这一难题。值得一提的是,当整个中文互联网都在关注 Sora 时,我们却选择了攻克图像生成中的幻觉问题。这个问题看似简单,甚至有些枯燥,但如果不解决,就无法实现真正的应用。我们开发了一项颠覆性技术,名为 iRAG,即基于图像的检索增强生成技术。
颠覆图像生成的新时代:iRAG 技术的强大潜力
在过去,依赖于大型语言模型的图像生成系统,所产生的视觉作品往往显得虚假,甚至逻辑上难以自洽。然而,百度推出的 iRAG 技术,巧妙地将海量的搜索图片资源与强大的基础模型能力结合在一起,从而创造出超现实的图像,整体效果远超传统的文生图系统,消除了机器生成的生硬感。接下来,让我们来分析一个具体案例,提示词是:
看看这幅图,里面的汽车真实得就像照片一样,我们不妨放大来仔细观察。
从车型到车标,均没有任何错误或变形,与长城背景的融合度也相当高。这幅图是利用 iRAG 技术生成的,其内容、氛围都极为真实,几乎与实际拍摄的海报无异。不过,现实中你的车是无法飞起来的,仿佛只是拼接上去的一样。
当然,您还可以让 AI 创造该汽车在不同环境下的图像,比如在荒野或城市的各种场景中。随着 AI 图像生成的可用性显著提高,其应用前景也随之拓展。例如,在品牌宣传方面,以前制作一组海报需要花费十几万甚至几十万,而现在,创作成本几乎降至零。
简单来说,iRAG 的商业价值体现为:没有幻觉、超现实、成本低廉,且可迅速获取。想象一下,如果生成的海报车型看起来像丰田,那将是多么令人沮丧的事情。
除了特定物品外,我们还能够生成特定人物与任意场景的组合照片。以爱因斯坦为例,我们可以生成一张他与天坛合影的图片。大家觉得这张图像是否相似?这完全是利用 iRAG 技术生成的。
我们使用相同的提示词,通过一些开源模型生成了几张图像,大家可以进行对比。有些图像根本不像爱因斯坦,而唯一一张看起来相似的,背景却明显不是天坛。
可以说,在国际范围内,百度的 iRAG 技术处于领先地位。我们还可以通过提示词,让爱因斯坦“游历”全球各地,比如悉尼歌剧院、复活节岛的巨石阵、长城、鸟巢等,显然,鸟巢是在爱因斯坦去世后才建成的。
作为一项基础技术,iRAG 在多个领域都有着广阔的应用前景。无论是影视作品、漫画创作,还是连续画本、海报制作,AI 图像生成都能显著降低创作成本。
今天,基础模型能力已经成熟,我们将在不久的将来迎来 AI 应用的璀璨时刻。每一个应用都是一颗闪亮的星星,未来的每一个应用都将成为改变世界的力量。
AI 的应用究竟源于何处,又将走向何方呢?
接下来,我将深入探讨两个主要的 AI 应用方向:其一是智能体,另一则是产业应用。
我们认为,智能体将成为 AI 应用的主流形式,并在不久的将来迎来其蓬勃发展的时刻。
如今,各大科技公司都在密切关注智能体的发展,但像百度这样将智能体视为核心战略的企业并不多。我认为,智能体的开发有点类似于 PC 时代的网站建设,或者移动互联网时期的自媒体账号。然而,智能体与这些传统形式的不同之处在于,它更具人性化,展现出更高的智能,能够充当销售人员、客服或助理的角色。可以预见,智能体有望成为 AI 原生时代内容、信息和服务的新载体。
为什么会有这样的看法呢?首先,智能体的制作门槛非常低,任何人都可以轻松上手。在百度文心智能体平台上,甚至可以看到 11 岁的小学生在创建智能体,并通过搜索引擎等渠道进行分发。其次,智能体的潜力极为巨大,能够开发出功能强大的应用。通过多个智能体的协作,也可以解决更为复杂的问题。在今天的最后部分,我将为大家展示一个多智能体合作解决复杂问题的令人惊叹的实例。
接下来,我将介绍四种不同类型的智能体:公司类智能体、角色类智能体、工具类智能体和行业类智能体。
首先,我们来看看公司类智能体,这可以被视为 AI 时代公司的官方网站。它具备传统网站所拥有的功能,如公司简介、产品图片及参数展示、线下门店位置等,同时还具备传统网站所不具备的主动推荐、即时响应和一对一服务的能力。
以比亚迪的智能体为例,我们可以将其与传统官网进行比较。
在百度中搜索“比亚迪”,即可直接访问其官方智能体。进入后,智能体首先会为您提供一段简短的比亚迪品牌介绍,这与传统官网的功能相似。
接下来,您可以请求它推荐一款性能均衡的车型。至于“性能均衡”这个概念,传统官网无法理解并提供建议,而凭借强大的模型理解能力,智能体则能够有效筛选,给出合适的推荐,并展示相关产品的图片。
智能体的崛起:重新定义用户体验
在你对多款车型感兴趣,想对比选择最值得购买的车时,传统官网往往需要耗费不少时间。每款车型的详细信息页都是独立的,因此你需要频繁切换不同页面,这无疑是一件费时费力的事情。而智能体则能够将多个车型的动力类型、车身尺寸、续航能力和加速性能一并整理成表格,展示的方式十分直观。
如果你希望进一步到线下门店进行试驾,智能体同样可以协助你。它能够直接调用地图功能,为你提供一键导航,确保你能顺利抵达目的地。
此外,智能体在获取最新信息或解答个性化问题方面,展现出与传统官网的显著差异。传统官网对市场变化反应迟钝,客服人员在面对个性化咨询时也难以提供满意答复,通常只能记录并进行电话回访。而智能体则依靠其强大的理解、生成、逻辑推理和记忆能力,迅速从网络上获取最新、最准确的信息,能够在短短一秒内给出令人满意的答案。
当你遇到更复杂的问题时,智能体能够通过与用户的互动、澄清和反问,逐步满足你的需求。
不仅是比亚迪,许多企业如联想、沙宣和洋河等,均已推出自己的官方智能体。与传统官网相比,智能体不仅是品牌顾问,更是销售和客服的金牌代表,提供专业且贴心的一对一服务,极大提升了互动营销的效果。比亚迪的官方智能体上线后,销售线索转化率增加了 119%。而联想的 AIPC 智能体在 9 月份的互动率提升了 89%,销售线索转化率也提高了 80%。
展望未来,企业的官方智能体有可能会取代传统官网,成为最直接与消费者沟通的界面。
接下来,我们来探讨第二种类型的智能体——角色智能体。提到角色,许多人会联想到数字人。数字人具备独特的人设与知识库,这些都是智能体的基本要素。
当智能体机制与多模态技术有效结合时,它便演变为一个有形象、有动作并且能够与语言匹配的数字人。以往的数字人存在明显短板,声音、肢体动作和口型都显得机械而呆板。然而,在强大的大模型技术支持下,数字人逐渐转变为高度拟人化的智能体,变得更加聪明、富有情感和态度。他们可能是教育辅导教师、留学顾问,甚至是心理咨询师和私人健身教练等,广受欢迎。
今天,当你在百度搜索“教育辅导”等关键词时,可以看到这些更加自然的数字人。他们的动作幅度更大,甚至在直播场景中能够在适当时机停顿,回应观众的提问。这样的能力源于大量数据的积累与直播互动规律的总结,以前的技术无法实现。因此,如今的数字人直播,很多情况下,转化率已超过真人。
虚拟人和智能工具的全新互动体验
如今的数字人展现出极为自然的动作、语言和口型,若不提及其身份,几乎让人无法辨别其为虚拟存在。这些数字人的背后,是完全由人工智能生成的脚本,涵盖了大量且详尽的数据,这一点是人类在直播时难以做到的。因此,数字人所具备的知识量与反应能力,往往已经超越了普通人类的表现。
我们坚信,真人与虚拟人之间的互动,能够创造出巨大的经济和社会价值。这里所说的虚拟人,可能是现实生活中某位优秀教师的数字化身,亦或是一位杰出医生、顶尖律师及金牌销售的数字化代表,而当今的技术使我们比以往任何时候都更接近他们。
接下来,我想谈论第三种智能体——工具类智能体。工具类智能体无疑是当今热门的领域之一。像笔灵 AI 写作、Canva 设计助手、logo 生成器等,都是这类智能体的典型代表。
在此,我将向大家展示一种新颖的工具类智能体——“自由画布”,这是由百度文库与网盘联合开发的。以行业分析师撰写研究报告为例,借此向大家介绍自由画布。许多人认为,行业研究报告仅仅是图文结合的内容。
然而,今天的行业研究报告可以呈现出多样化的形式,除了传统的图文和表格外,还可以结合发布会视频和电话会议录音,形成更全面的多模态报告。在自由画布中,这种多样性得到了很好的实现。让我们来进一步了解自由画布的概念。
首先,打开百度 APP,搜索“智能写作”等相关关键词,你就能找到“自由画布”这一智能体,它可以帮助你完成从信息收集到编辑、再到生成和分享的全过程。
第一步是输入自由。自由画布有效连接了公共领域和私人领域的数据。例如,文库中公开的高质量文档或片段,外部网页上公开的内容,可以一键摘录到自由画布上。而来自私域的内容,比如在网盘中记录的多场电话会议的音频,或存储的专业视频和深入的调研报告等,无论格式或来源如何,都可以轻松拖入画布。这便是输入自由的体现。
第二步是编辑自由:用户不再需要处理居中、调整字号、排版等繁琐的基础工作。我们重新定义了编辑过程,让用户成为指挥者,通过批注的方式向 AI 指示如何利用素材,或者圈选出最需要的内容片段,甚至是直接复用的部分,以确保生成的内容完全符合用户的真实意图。
第三步是创作自由:在标注了重点后,用户可以选中所有所需素材,一键生成,AI 会根据输入和要求开始进行思考,并在相应章节中利用相关素材,生成结构清晰、富有创意的全新内容。
探索创作的无限可能:自由画布的奇妙之旅
当然,用户可以随时打开这些文件进行局部修改,或是进行改写、扩展和续写。这样一来,既可以在画布上梳理思路,进行草稿创作,又能在文档中进行细致的完善,轻松应对各种需求。
最后,我们称之为分享的自由:所生成的内容能够保存到本地,也可以上传至用户的个人云盘,甚至通过链接分享给他人,无论是行业交流群、朋友圈还是其他社交平台,皆可直接点击链接进行观看。
因此,不论你是内容的创造者还是接受者,都无需再担心文件格式、设备是否安装了相关应用程序,或者内存是否充足等琐碎问题。
除了上述办公场景,我还想展示一个更偏向个人创作的例子。大家都知道,今年《黑神话:悟空》非常火热,我们想借助 AI 的力量,放飞想象,探索一下大圣穿越现代会发生哪些趣事。
根据我的要求,自由画布为我创造了一个关于大圣在现代探险的故事。
那么,我们是否可以基于这个故事,创造一幅漫画呢?当然可以!在这幅漫画中,孙悟空游历了山西的多个打卡圣地,最终抵达了上海。请大家注意,漫画中不同场景里的孙悟空保持了一致性,无论从哪个角度看,都是同一个孙悟空,并且在故事情节中展现了相应的动作。
漫画生动有趣。那么,我们能否让 AI 进一步生成视频呢?让我们来看看:
大家可以看到,漫画中的对话被转换成了字幕和配音,使得整个故事更加生动有趣。
如果我们再大胆一些,设想一个小朋友穿越到花果山会怎样?其实,这非常简单。只需上传一张小朋友的照片,就能将他融入到这个个性化的画本中。你们看,自由画布已经为我们生成了一个小朋友梦游花果山的故事。接下来,只需点击制作画本,画面中小朋友的表情与真实照片非常相似。
通过以上示例,大家可以体会到自由画布作为文心多模态大模型的支持下,成为了一块充满创造力的万能白板。它激发了人们的无限灵感与创造力。借助自由画布,每个孩子都能成为故事的主人公,每个人都能化身漫画家或短视频导演。这不仅是期望,而是现成可用的工具,真正为创造力服务的新型生产力!我们将很快正式上线。
探索行业智能体:法行宝的强大功能
我们现在讨论一种被称为“行业智能体”的新型智能体。这类智能体在多个领域如法律、医疗、金融、体育和旅游等方面展现出极大的潜力和实用性。
接下来,让我们以法律领域的智能体——法行宝为例,深入了解它的功能。
在日常工作与生活中,许多人可能会遇到各种法律问题,但并非每个人都能及时找到专业律师提供帮助。在这种情况下,法行宝便显得尤为重要。作为一款备受欢迎的智能体,它在百度平台上成功回答了超过 1660 万个法律相关的问题。
那么,法行宝究竟能为用户提供哪些具体服务呢?
假设我的一位朋友昨日遭遇了交通事故,目前正在医院接受治疗并承担了高额费用。警方已经确认对方负全责,但对方却拒绝赔偿,应该如何处理呢?
对于这种情况,法行宝提供了四个步骤的指导:首先,保留所有相关证据;其次,向交管部门申请调解;如果调解未果,则可以提起民事诉讼并申请法院强制执行。你或许还会关心,若对方最终赔偿,赔偿金额大概会是多少?这同样可以向法行宝咨询。
例如,医生告知他需要三个月的时间才能恢复正常行走,那交通事故的赔偿该如何计算呢?
此时,法行宝能够提供一个赔偿计算器,要求你输入事故的相关细节,例如责任认定、发生时间和地点、伤者的工作收入及伤残程度等,最终会计算出事故导致的总损失及应得的赔偿金额。
如果你希望通过起诉来追讨这笔赔偿金,法行宝还可以协助撰写起诉状:
请帮我撰写一份交通事故的起诉状。
法行宝:智能法律助手的崛起与应用
和以往一样,法行宝会询问有关身份和代理人的详细信息,随后为您生成所需的文件。现在,我们可以看到起诉状已完成,只需填写相关事实即可应用。因此,法行宝不仅能够提供专业律师的解答,还具备强大的生成能力,能够制作起诉文书。
当然,如果您希望咨询更复杂的私人问题,法行宝同样可以为您推荐不同领域的知名律师,以便获得更深入的帮助。
自上线以来,法行宝已经为超过 940 万人提供了高效且值得信赖的法律服务,迅速成为普通民众的 AI 免费法律顾问。
目前,文心智能体平台吸引了 15 万家企业与 80 多万名开发者参与,涵盖的应用场景极为广泛。
现在大屏幕上展示的正是文心智能体平台的前 100 个智能体。这些智能体是根据分发量、平均对话轮次和用户满意度等多个指标综合评选出的,包括角色类、工具类、行业类等多种类型,涵盖职场、情感和娱乐等多个领域。
百度还与英伟达携手合作,启动了“文心智能体创新大赛”,涌现出许多有价值的智能应用。
前面我提到了智能体,接下来我们来讨论一下大模型在产业中的应用。
大模型如何在产业中实现落地?它又如何为各行各业创造新的价值?这些都是我们一直在深入探索的问题。在过去的一年半里,我们观察到,在金融、能源、教育、招聘和公共服务等多个领域,大模型与实际场景结合后,在降低成本和提高效率方面均取得了显著成果。
百度智能云是我们构建智能产业生态的重要依托。目前,在百度智能云的千帆大模型平台上,我们已帮助用户精调了 3.3 万个大模型,并开发出 77 万个企业级应用。百度智能云在中国的大模型产业落地规模方面处于领先地位,超过一半的中央和国有企业,以及众多民营企业,都在与百度智能云合作进行 AI 创新。
接下来,让我们来看两个实际案例:
首先,让我们聚焦于百胜中国,这是一家在国内餐饮行业中占据领导地位的大型企业。大家熟悉的肯德基和必胜客,均为其旗下品牌。百度与百胜的合作关系一直以来都非常良好,最初的合作主要集中在门店选址评估上,百度帮助百胜精准选址,新增数千家门店,有效提高了选址的质量及效率。在客户服务方面,我们为百胜提供了客服产品和大模型能力,服务于其众多品牌,尤其是解决了之前客服机器人无法准确理解客户需求和关联上下文的问题。
目前,我们的客服解决方案已经全面覆盖了百胜的各个业务线,大模型的日调用量峰值已达数百万,客服机器人的问题解决率提升至 90%。在大模型的新时代,百胜还需建立一个安全可靠的大模型服务专区,以满足各品牌和业务线在 AIGC 应用方面的需求。
为了实现这一目标,我们为百胜提供了千帆平台、文心 Speed 模型及基础云算力服务,构建了高效的大模型基础能力,使百胜在开发和部署 AI 应用时更加便捷。
此外,我们与百胜共同探索 ASR(自动语音识别)、TTS(文本转语音)以及数字人技术的结合,正在验证在点餐终端上实现基于大模型的点餐能力。
展望未来,我们将继续深化合作,共同探讨企业在数字化和智能化转型方面的各种可能性。
接下来,让我们转向互联网行业的代表——智联招聘,这是国内知名的招聘平台。
招聘平台的核心任务在于将合适的人才与合适的岗位进行匹配。以往,这一过程主要依赖人工完成,人工对岗位进行标签、筛选大量简历以及分析求职者对话,这不仅耗费时间和精力,且效果难以保证,常常出现遗漏或错配的情况。
为了解决这个问题,百度与智联招聘展开了合作,借助大模型对这一核心环节进行了重塑。通过自然语言对话技术,结合岗位描述,系统能迅速为求职者与岗位绘制出精确的匹配画像,并自动回答求职者关心的工作时长、薪资福利、工作地点等问题,更进一步地还可协助安排面试。这不仅为求职者推荐了合适的职位,也为用人单位精准筛选出所需人才,大幅提升了招聘效率与质量。目前,百度与智联招聘的合作已成功形成一系列提示词模板,并在数万条实际数据中进行了验证,人岗匹配的平均准确率达到 93%,而大模型的使用成本却降低了约 90%,为招聘行业带来了显著的变革。
这样的合作模式使得每位求职者都能轻松找到理想的工作,同时也让企业更高效地获取所需的人才。
今天,我在此宣布基于大型模型开发的百大产业应用,涵盖从制造业到金融、交通、教育等多个领域。百度渴望与众多合作伙伴和客户携手,推动智能产业生态的构建,共同加速实现国家的“人工智能 +”战略目标。
发布这百大产业应用,实际上体现了我们的理念和立场。百度并非旨在推出单一的“超级应用”,而是希望持续支持更多个体和企业开发出数以百万计的“超级实用”应用。
如今,我们的确具备条件使得连代码都看不懂的人也能拥有编程能力,能够让任何创意迅速且以较低的成本转变为现实。当然,这需要一个工具,而我今天要为大家介绍的正是这个工具——秒哒!
秒哒是一款无需编写代码便能实现各种想法的软件,它由大模型和智能体构成。我认为它是人类历史上最复杂的多智能体协作工具,具备无代码编程、多智能体协作及大规模调用各种工具的能力。
需注意,秒哒与其他任何辅助代码生成工具截然不同,使用时无需理解代码。因此,正在观看直播的程序员朋友们,如果你是程序员,或许可以暂时离开,这款软件主要是面向非程序员的。
让我通过一个实例来展示秒哒的强大功能:
假设我们需要为萝卜快跑组织一场新技术发布会。我需要创建一个活动邀请系统,将邀请函分享给他人,并收集他们的意见和反馈。首先,我将包含大会时间、地点和主题的文件上传至秒哒。
现在,让我们看看秒哒将如何满足我的需求。当指令被接收后,屏幕上出现了 0 号智能体,即小组长。它是整个智能体团队的核心,负责规划和调度。它将这个任务分解为需求确认、内容生产和工程开发三个步骤,并告知我会召唤各个智能体共同完成任务。
首个被召唤的是 1 号智能体,负责策划活动邀请函的设计与方案制定。1 号智能体将任务进一步细分为核心需求、内容结构、开发需求和数据收集四个子任务。
接着,2 号智能体被召出,它是负责编辑的智能体,主要任务是处理邀请函中的所有文字和媒体内容。邀请函正文需要包含一段关于发布展望的描述,该智能体通过全网搜索与总结,撰写了一段关于萝卜快跑的精彩内容,并自动从上传的文件中提取时间、地点等关键信息,将其放置在适当的位置。
颠覆传统的智能邀请系统,让创意轻松成真
关于封面图的设计,我提出了新的创意需求,向智能体提供了几张萝卜快跑六代车的图片,期望它能生成一幅充满未来感的图像来作为邀请函的封面。显然,智能体运用 iRAG 的能力,成功创作出了一幅包含 RT6 的封面图。
接着,第三号智能体登场,这是一位程序员智能体,专门负责编写代码以制作和部署网页。大家可以看到屏幕上,智能体正在自动生成代码。其实,你不必深入理解这一过程,只需关注能理解的内容即可。
在它完成代码编写后,第四号智能体作为质检员出现,发现了一个错误,于是召回程序员智能体,进行代码的重新编写和修改。质检员智能体利用反思能力,执行测试代码,以确保代码能够正常运行。
现在,智能体已经修复了代码,并自动生成了邀请函。然而,我觉得这幅设计效果不够理想,想要更具科技感的版本。在输入这个想法后,程序员智能体再次编写代码,提供了一个新版本。这次的设计采用了更具科技感的色彩,包含了邀请函、会议日程,最后还附上了参会报名界面。通过调用地图 API,嘉宾可以轻松导航到会场。我们输入了测试信息。
最后,在后台可以看到,这条报名信息已经成功记录在统计表格中。
整个邀请系统的创建,从开始到最终完成,仅需三分钟的时间,用户无需撰写一行代码即可实现。
这一过程充分体现了秒哒的三大特点:首先是无代码编程,其次是多智能体协作,最后是多工具调用。无代码编程由大型模型直接生成代码,用户不需要手动编写,显著降低了门槛,使得每个人都能参与其中;多智能体协作基于文心大模型的思考和规划能力,实现了对不同类型智能体的协调和编排,本任务中总共涉及了五个智能体的共同努力;而多工具调用在这个例子中表现得尤为明显,利用了三个工具,其中包括网页检索工具,用于寻找 RT6 的相关资料;iRAG 图片检索生成工具,确保在提供 RT6 图片的基础上保持精准度;以及地图 API 的调用。
借助秒哒,用户能够通过自然语言的交互,轻松构建完整的系统。
除了前面展示的邀请系统,秒哒同样可以应用于各种场景,其应用的复杂性也会随着技术的提升而不断增加。最初,它只能处理一些简单的编程任务,比如两三百行的代码。随着基础模型的能力提升以及秒哒自身技术的不断演进,它能够处理的任务也会越来越复杂。这意味着什么呢?这意味着用户无需再招募项目经理、设计人员、开发人员和测试人员等角色,便可以直接指挥多个智能体协同完成任务。只要你有创意,秒哒就能帮助你实现梦想,开启一个前所未有的只需想法便能盈利的时代。过去需要将想法付诸实践,如今只需轻松表达,秒哒就能为你实现。
AI 时代的崭新机遇与应用前景
我认为,人工智能之所以被视为产业革命的重要契机,正是由于它为社会经济带来了生产力的巨大扩展。秒哒的出现,使得每个人都能具备程序设计的能力,只需表达想法便能开发应用,这无疑极大地提升了人类的工作效率。现在,您可以提前预约,明年第一季度,秒哒将正式推出,届时大家都可以体验。
今天,我们花费了大约一个小时,回顾过去两年中,全球生成式 AI 的变革与应用爆发。同时,我们也发布了文心 iRAG 与无代码秒哒这两项技术,展示了智能体与产业应用的多个案例。从中可以清楚地看到,AI 应用的时代已经真正到来!
当然,在人类信息技术发展的不同历史阶段,应用的形式也有所不同:在个人计算机时代,它们是独立的软件与网站;在移动互联网时代,呈现为各类 APP 及其关注的账号。而如今的 AI 时代,智能体成为了最主要的应用形态。随着大模型技术的飞速发展,自然语言正逐渐成为这个时代最为重要的编程语言。每个人都可以动手创造出属于自己的 AI 应用,甚至是智能体。
作为一名软件工程师,我常常听到“软件吞噬世界”这一说法。然而,我更倾向于认为,这个世界应当是被创造而非吞噬。在 AI 时代,应用将塑造未来。因此,我希望大家和我一起见证,AI 应用如何重新定义我们的世界。
———————————————
雷递是由媒体人雷建平创办的,转载请注明出处。


听到文心幻觉现象消失,真心觉得AI的应用前景更加广阔了,大家可能会更愿意尝试。