共计 1124 个字符,预计需要花费 3 分钟才能阅读完成。
文|邻章
在 3 月 16 日,百度隆重推出其生成式人工智能产品——文心一言。

坦诚相待,业内对百度的这一新产品充满期待,因为它在一定程度上承载着中国人工智能对抗 Open AI ChatGPT 的希望。
巧合的是,在文心一言发布的前夕,ChatGPT 这个原本就备受瞩目的产品也迎来了重大的更新,从 GPT-3.5 升级至 GPT-4,许多功能得到了显著提升。
这无疑使得百度文心一言在尚未发布之时就承受了更大的压力。
正因如此,在文心一言发布前夕,网络上涌现出大量的调侃段子,对其表现产生了负面预期。
回到昨天的发布会现场,令人遗憾的是并未进行实地能力的演示,而是以录播形式呈现,这在一定程度上加深了外界对文心一言实际能力的怀疑。
因此,百度的股价在昨日也一度下跌了 9%。甚至讨论的焦点也逐渐转移到了公司的领导人形象等个人特征上。
这显然偏离了主题。
其实,我们更应该关注的,正是百度文心一言的实际性能如何?
答案需要在实际体验后才能揭晓,正如所说的,没有亲身使用便无权评价。
然而,遗憾的是,许多人在评价文心一言时,并未有过实际操作的经历,因此评价自然难免片面。
当然,这也与百度文心一言尚未全面开放给用户使用有很大关系。
幸运的是,我个人获得了文心一言内测的首批资格,随即进行了实际测试。
以下是我对百度文心一言能力的测试截图。
(1)词义理解

(2)玩梗

(3)程序编写

(4)提纲撰写:

(5)文章撰写

(6)计算与时事回答

(7)AI 绘画

从整体评估结果来看,百度的文心一言在文学创作(如通知、新闻稿、文章撰写)、数学推理(部分)、中文理解及绘画创作等多个领域都表现出了能力。然而,在回答问题时,有时会出现似是而非的情况,无法准确总结要点,且对部分时事内容的回应也显得不足,这可能与其训练数据相关。
综合来看,我认为:尽管文心一言的整体表现没有超出预期,但也并非如一些段子手所嘲讽的那样毫无价值。
或许正是因为越来越多的用户对文心一言进行了实际测试,对其能力有了更深入的理解,使得当前市场对百度的信心得以恢复。
这从今天百度股价上涨 15% 这一现象中,可以看出市场的反应。

总结思考:
任何伟大的旅程都始于第一步,百度文心一言已经开始了它的探索之路。虽然现在的表现尚未达到完美的标准,但回顾整个行业,连 ChatGPT 也是经过多次迭代才逐渐形成了如今的状态。因此,我们在此也应给予百度文心一言必要的成长空间与时间。