共计 3899 个字符,预计需要花费 10 分钟才能阅读完成。
作者 | 云鹏
编辑 | 漠影
当今,迅速演进的大模型技术正在深刻影响各行各业。
与此同时,大模型技术本身也在不断演化,各类新模型层出不穷,应用于多个垂直行业的深度也在加深,衍生的新产品不断开拓新的应用场景。
根据彭博社的研究,到2032年,生成式AI市场可能达到1.3万亿美元(约合人民币9.5万亿元),大模型在颠覆传统工作模式和创造新市场机会方面显示出巨大的潜力。
然而,新的技术不仅带来机遇,同时也伴随挑战。如今,全球AI领域的竞争已经达到前所未有的高度,技术迭代的速度也远超以往,大模型的更新频率从每月缩短至每日。
国内外大模型市场正在经历“洗牌”现象。在这样的行业背景下,企业的技术创新能力显得尤为重要,能否在竞争中立于不败之地,完全依赖于其技术实力。
最近,全球知识产权解决方案提供商Questel发布了《2024深度学习专利全景报告》,该报告分析了大模型和深度学习领域全球专利申请及其发展状况,也反映出AI行业各方在基础技术布局方面的动态。
值得注意的是,无论是深度学习还是大模型专利,我们都可以看到许多中国公司名列前茅,尤其是在深度学习专利排名中,百度以6751件专利申请量高居全球第一,领先第二名三倍以上,实属“遥遥领先”。
▲全球深度学习专利企业申请人排名
在全球大模型专利方面,谷歌以283件申请位列首位,百度的申请数量达278件,几乎与谷歌相当,位居中国第一,而腾讯与阿里则紧随其后。
▲全球大模型专利企业申请人排名
可以说,在深度学习和大模型等核心AI技术创新领域,中国企业已经走在了前列,甚至部分领域实现了领先,而百度则成为其中的佼佼者,这对中国AI产业的发展意义重大。
深入分析专利,我们发现百度的多项专利在技术创新与产业应用价值之间取得了良好的平衡,在2025年大模型变革之年,百度势必将继续在行业中占据重要地位。
一、在多个细分领域专利布局中占据领先,突破传统AI模型的限制
根据Questel的报告,百度在搜索、虚拟助手、安全、法律和情感分析等多个细分应用领域的专利布局较为广泛,而这些领域几乎都是当前产业落地的重点方向。
在这些细分领域中,百度的大模型专利申请已稳居全球领先地位,这充分显示了百度在大模型技术与应用方面的卓越实力。
以搜索和虚拟助手等领域为例,我们可以观察到AI产业中一个显著的趋势,即AI智能体的不断涌现,而当今的智能体已经不再是传统的机械问答语音助手,它们需要提供真正个性化的AI体验,AI必须深入了解用户,准确把握他们的需求,并能够快速高效地调用各种应用和服务来满足这些需求。
为了实现这些体验,模型层面的技术优化是必不可少的。
例如,百度的一项专利涉及大模型数据生成,使得深度学习模型能够动态调用外部资源,诸如记忆库、搜索引擎和API等。这样,模型便能实时获取外部数据,从而弥补模型内部数据的不足,打破了传统AI模型的限制。
▲ 数据生成方法示意图
具体而言,长期记忆增强技术可以引入外部记忆库,使得模型具备长时间记忆用户历史输入和反馈的能力,从而提升对多轮对话和长期交互的支持能力。
在实时问题回答方面,模型能够依靠外部搜索引擎或检索模型,实时获取外部知识与动态数据,以增强生成内容的时效性与准确性。
此外,模型也能调用外部API,例如计算器、智能家居控制等,具备实际的任务执行能力,转变为任务型AI助手。
在多轮对话与逻辑推理方面,模型通过扩展知识来源与灵活调用组件,提升生成内容的准确性、上下文相关性和丰富性,从而更好地满足用户的需求。
显而易见,专利中这些模型能力的提升针对性极强,能够有效改善搜索、虚拟助手等领域普遍存在的痛点问题,例如智能客服、AI智能体、AI教育和AI医疗等场景。
例如,在目前广受欢迎的AI智能体应用中,这项专利技术能够真正赋予AI长期记忆,从而更好地“记住用户”,成为真正的全能助手和贴心管家。
假设你之前让AI推荐过几首歌曲,过一段时间后,你可以直接对AI说,给我推荐一些与上次曲风相似的歌曲,模型就能通过调用外部记忆库,找到之前推荐的歌曲,并生成有针对性的回复,而不需要你重新提供听歌偏好等信息。
在智能客服的场景下,这项技术同样能够显著提升用户体验,模型能够通过外部记忆库了解我们的订单信息和各种繁琐的数字,从而省去每次都需重新提交这些信息的麻烦,使得沟通更加高效。
可以说,这类专利技术显著提升了AI大模型在多种对话场景中的应用体验,赋予AI记忆,使其更加富有人情味。
二、深厚专利布局落到实处:文心大模型日均调用15亿次
在深度学习和大模型领域,百度还有许多类似的专利申请,其显著特点之一是拥有极高的产业化与商业化价值,是真正针对行业痛点的技术创新,而非单纯的表面功夫。
百度研发的基于图像的检索增强技术iRAG显著降低了图像生成的幻觉问题,使得图像生成应用的体验得到显著提升;而在全球大会上展示的“秒哒”,则使得不懂编程的普通人也能拥有程序员的能力,与全球主流的代码辅助生成形成鲜明对比。
从Questel的报告中可以看出,百度作为深度学习和大模型领域的领军企业,在技术和生态方面为AI产业的发展做出了巨大的推动,成为全球行业智能化升级的重要推动者,无论是对消费者还是企业来说,影响深远。
根据统计数据,截至2024年11月,百度的文心大模型日均调用量已超过15亿次,相比一年前增长了30倍。同时,文心大模型日均处理的Tokens文本也超过了1.7万亿,而文心一言的用户规模达到了4.3亿。
与此同时,百度飞桨的开发者人数已突破1808万,凭借其强大的技术基础,百度能够为各种应用场景量身定制基础模型,从而丰富轻量级模型的产品线。
当前,百度服务的企业总数已超过43万家,共计创建了101万个模型。这些模型在各自领域的细分业务中发挥了不可或缺的作用。
三、创企洗牌求存,AI大模型产业激变在即,巨头挑梁冲刺超大模型
展望未来,2024年被视为大模型产业化、商业化的关键年,而2025年则可能是对这一进程的全面检验,行业洗牌迫在眉睫,各种因素交汇,让巨头和初创企业无不紧绷神经。
相较之下,年轻的AI初创公司面临更大的压力,若2024年是它们的“追梦”之年,那么2025年则更像是“求生”之战,如何实现独立生存、找到核心应用、推出自有产品、赢得市场认可,成为每个创企必须直面的挑战。
李开复在谈及零一万物事件时表示,今年将成为大模型商业化的淘汰年,也是中国大模型考验和应用爆发之年,只有大企业能够支撑超大模型的研发,初创公司在投入超大模型预训练时性价比极低。
MiniMax的创办人闫俊杰曾在2024年中期的演讲中提到,未来全球可能只剩下5家大模型公司,而投资人朱啸虎也曾表示,5年后独立的大模型企业将不复存在,原因在于成本已经低于市场价格,创业公司难以追赶。
在国内,被誉为“大模型六小龙”的企业,正努力在大企业的夹缝中求生。
尽管“狭路相逢勇者胜”,但在当今的AI行业,单凭一时的勇气或者热情已不足以支撑企业的长久发展,最终较量的仍是硬实力,包括技术、人才储备及资金实力,而在这些方面,以百度为首的互联网巨头显然具备更大的优势。
如今,大模型之战愈演愈烈,算力与能源的争夺愈加紧迫,面对全球AI技术的飞速进步与激烈竞争,中国若想在全球市场上获得领先,并在AGI目标上取得显著突破,必然依赖于大企业,而初创企业则需为其让路,这似乎已成行业共识。
在这样的背景下,百度在多个关键领域拥有显著的优势。
首先是技术的累积与创新。自2013年进入AI领域以来,百度的研发投入已接近1700亿元,可以说是国内较早涉足AI的互联网企业之一。
在真实的研发投资下,百度文心大模型在迭代速度与商用落地方面的表现均属一流,许多关键趋势与节点上,百度都屡次展现出其身影。
例如,在当前AI赛道备受关注的智能体领域,百度文心智能体技术获得了2024世界互联网大会领先科技奖,其技术突破推动了文心大模型能力的提升,加速了代码智能体、农民院士智能体和个人助手等应用的迅速崛起,为经济社会发展带来了更多价值。
展望下一代模型,百度也在积极布局,创始人兼CEO李彦宏在2024年第三季度的财报电话会议上透露,百度计划于2025年初推出文心大模型的新版本,以巩固其在基础模型领域的领先地位。
与其他大企业相比,百度在训练下一代超大模型方面,凭借独特的数据与场景优势,拥有无可比拟的资源,包括来自搜索引擎的大规模中文数据、智能云积累的企业场景数据、AI原生应用生成的用户交互数据,以及自动驾驶带来的高质量多模态数据。
可以说,从产业发展趋势、技术创新能力到全产业链生态的数据积累,百度已成为中国大模型产业发展的关键因素。
结语:2025,AI井喷式增长继续,机遇挑战并存
正如李彦宏在全员信中所述:当今人工智能领域,竞争愈发激烈,技术迭代速度空前加快,面临的挑战也是前所未有。
机遇与挑战并存,中国AI迎来新纪元
挑战的同时,也蕴含着丰富的机遇。在面对国际科技巨头所带来的压力时,中国企业的优势正体现在大模型技术的迅速发展上。深耕底层技术创新,不仅会为后续的产业化应用提供竞争优势,还将推动中国的人工智能在国际舞台上迈出更大步伐,获得更强的话语权。
如今,人工智能大模型在各个行业的应用如火如荼,渗透率不断提升,预计到2025年将迎来更为迅猛的增长。我们期待以百度等中国互联网巨头为代表,能够在2025年这个充满变革的时刻为产业带来更多意想不到的惊喜。