共计 2016 个字符,预计需要花费 6 分钟才能阅读完成。
本报记者 袁传玺
随着人工智能技术的迅速进步,尤其是大模型的调用频率也在急剧增加。就在 11 月 12 日于 2024 百度世界大会上,百度发布了文心大模型的最新统计数据:截至 11 月初,其日均调用次数突破了 15 亿,相较于 5 月份的 2 亿次,增长了 7.5 倍,而与一年前的 5000 万次相比,增长幅度更是达到约 30 倍。百度创始人李彦宏指出,这一增速远超预期,表明了市场对 AI 的真实需求。
此外,为了进一步推动 AI 应用的开发,百度在会议上推出了两项全新的 AI 技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”。
李彦宏表示,iRAG 技术旨在解决大模型在图像生成中存在的幻觉问题,从而显著提高其实用性。而“秒哒”工具则赋予每位用户程序员的能力,助力创造数百万个“超级有用”的应用。
iRAG 技术的突破
长期以来,大模型的幻觉问题一直是制约 AI 应用广泛落地的关键。解决文本生成中的幻觉问题所依赖的技术是 RAG(检索增强生成),经过两年的发展,这一技术逐渐引起业内关注。李彦宏提到,虽然文字层面的 RAG 技术已基本消除了大模型的幻觉问题,但基于大语言模型的文生图功能仍面临显著的幻觉困扰,严重影响了其实际应用的效果。
“尽管大模型已成为当前最热的风口之一,但在如何推出具有影响力的应用以及将大模型转化为实际生产力方面,市场参与者依然任重道远。”Dante Research 创始人陈达在接受《证券日报》采访时表示,当前大模型在应用过程中仍存在许多需改进之处。例如,文字生成图片时可能出现的幻觉问题,若“准确性不足”,则会使得大模型在生产力应用方面显得“效果不佳”。
为了解决这一难题,百度推出了检索增强的文生图技术 iRAG(image based RAG),它结合了百度搜索的亿级图片资源与强大的基础模型能力,能够生成超真实的图像,大幅降低了大模型幻觉的发生率,整体效果远超传统文生图系统。同时,由于 iRAG 技术显著提升了 AI 生成图像的可用性,企业和用户的使用成本也将大幅降低。
陈达指出,百度通过不断打磨大模型并推向市场,旨在提升图片生成的精确性,增强其实用性,具备无幻觉、超真实、低成本及即时可用等特性,从而有效解决图片生成的幻觉问题。这不仅为行业提供了新的思路,同时也为 AI 应用的发展开辟了新的机会。
艾媒咨询 CEO 张毅对《证券日报》记者表示,iRAG 技术通过高精度的图像生成,降低了创作成本,为广告和设计等行业提供了创新工具,显著提升了工作效率和创意空间。此外,iRAG 在解决行业痛点方面展现出巨大的潜力,进一步激励企业探索更多 AI 应用场景。
李彦宏强调,消除大模型的幻觉问题是 AI 应用爆发的基础。他认为,现今基础大模型的能力已经成熟,即将迎来 AI 应用的璀璨时刻。
智能体的崛起前景
如今,AI 已经成功融入了用户的生活与工作,智能体(能够感知环境并采取行动的代理体)也成为各大平台争夺的新焦点。“智能体是 AI 应用的主要形态,正面临爆发的机会。”李彦宏表示,全球顶尖科技公司正密切关注智能体,就如同 PC 时代的网站和移动互联网时代的自媒体账号一样,在 AI 原生时代,智能体将成为内容、服务和信息的新载体。目前,文心智能体平台上,已有 15 万家企业和 80 万名开发者参与其中。
例如,比亚迪的官方智能体上线后,销售转化率提升了 119%;法律智能体“法行宝”自上线以来,共回答了用户 1660 万个法律问题。
海通证券发布的研究报告显示,预计到 2026 年,中国的人工智能市场规模将超过 260 亿美元。在国家政策的支持和各大企业积极投入的背景下,智能体技术不断进步,尤其是在算力快速增长的情况下,智能体的发展前景愈发值得期待。
为了进一步扩展智能体生态,百度推出了无代码工具“秒哒”。这一软件无需编写代码,用户只需通过自然语言描述需求,即可实现各种应用的构建。它具备无代码编程、多智能体协作和多工具调用三大特性,极大降低了应用开发的门槛。
李彦宏表示,“秒哒”是一个复杂的多智能体协作工具,让每个人都能成为程序员,只需用语言表达需求,即可完成应用开发。这意味着每个人都可以驱动多个智能体协作完成任务,达成“只要有想法,就能实现愿景”的目标。
一位不愿透露姓名的行业分析师在接受《证券日报》采访时表示,随着 AI 技术的不断革新,智能体将具备更高效的决策、学习及适应能力,从而在众多行业中发挥重要作用。无论是医疗健康、金融服务,还是制造业和教育培训,智能体都将深度融入并推动行业变革。此外,它还将引领新型商业模式的出现,创造丰富的就业机会,为社会经济发展注入新的活力。

