共计 1469 个字符,预计需要花费 4 分钟才能阅读完成。
3月16日,百度举行了文心一言的发布会,推出了其生成式人工智能产品文心一言。百度的创始人兼首席执行官李彦宏出席了此次活动,并展示了文心一言在五个不同场景下的综合能力。
根据发布会的展示结果,文心一言在一定程度上已具备理解人类意图的能力,其回答的准确性、逻辑性和流畅性正逐渐接近于人类的水平。不过,李彦宏强调,这类大型语言模型仍处于发展初期,尚有广阔的提升空间,未来的进展将是迅速而显著的。
01
五个应用场景
在发布会现场,李彦宏展示了文心一言在五个不同使用场景下的表现,包括文学创作、商业文案撰写、数学推理、中文理解以及多模态生成。
在文学创作方面,文心一言根据提问总结了著名科幻小说《三体》的核心内容,并提出了五个续写的建议角度,展示了其在对话问答、总结分析及内容生成方面的综合能力。
此外,文心一言还能够准确回答关于《三体》的作者、电视剧中角色的相关事实问题。通常生成式AI在处理事实性问题时容易出现错误,而文心一言承袭了百度知识增强模型的理念,显著提高了事实问题的准确性。
据悉,文心一言的智能表现源自于庞大的数据基础,这一过程被称为“智能涌现”。
其训练数据包含万亿级网页信息、数十亿的搜索数据和图片数据、每日百亿次的语音调用数据,以及5500亿条事实构成的知识图谱,这使得百度在中文处理领域具备独特的竞争优势。
作为扎根于中国,生长于学术气息浓厚的海淀区的大型语言模型,文心一言在中文自然语言处理方面处于领先地位,在理解中文和中国文化方面表现尤为突出。在现场展示中,文心一言不仅准确解释了成语“洛阳纸贵”的含义,还将其对应的经济学理论进行了说明,并用“洛阳纸贵”四个字创作了一首藏头诗。
02
百度的独特技术优势
李彦宏指出:“无论哪个公司,都无法在短短几个月内开发出如此复杂的大型语言模型。深度学习和自然语言处理是需要多年积累的过程,无法一蹴而就。”
可以说,文心一言是百度在过去多年努力的成果。随着人类进入人工智能时代,IT技术的结构发生了根本性的变化,从原来的三层架构变为如今的“芯片-框架-模型-应用”四层架构。现今,百度是全球为数不多的在这四个层面上进行全面布局的人工智能公司,其自研技术涵盖了从高端芯片昆仑芯到飞桨深度学习框架,再到文心预训练大模型,以及搜索、智能云、自动驾驶和小度等多项应用。
李彦宏认为,百度在AI领域的全栈布局优势允许其在四层架构中实现端到端的优化,大幅提升整体效率。尤其是在框架层与模型层之间,存在强大的协同效应,有助于构建更高效的模型,并显著降低成本。实际上,超大规模模型的训练和推理对深度学习框架提出了巨大的挑战。例如,为了支持千亿参数模型的高效分布式训练,百度飞桨特别研发了4D混合并行技术。
在全球范围内,几乎没有公司在这四层架构的每个层面都有领先产品,这使得百度拥有非常独特的竞争优势。未来,芯片、框架、大模型以及终端应用之间将形成高效的反馈循环,助力大模型的持续优化,从而提升用户体验。
因此,自从百度推出文心一言以来,短短一个月内,已有650家企业宣布加入文心一言的生态。此外,百度也计划将文心一言整合到搜索、智能云、自动驾驶等多个主流业务中。这款源自海淀科技沃土的尖端语言模型,正在绽放出璀璨的光芒。
记者:郭思岐
编辑:罗雨涵