共计 2581 个字符,预计需要花费 7 分钟才能阅读完成。
作者 | 虞景霖
编辑 | 邓咏仪
经过半年的沉默,字节跳动终于带来了自家大模型的新动态!
在没有任何预兆的情况下,8月17日,字节跳动正式宣布启动AI对话产品“豆包”的外部测试。用户可以访问官网(https://www.doubao.com/ )进行注册,或通过提供的二维码下载应用程序。
在“豆包”问世之前,字节跳动最近的一次AI进展是6月曝光的内部项目“Grace”。
根据Tech星球的报道,Grace在7月就已开始进行小规模的内测,并最终更名为“豆包”,正式向公众开放。
然而,36氪的最新消息显示,字节的Grace并不是“豆包”的前身,Grace在内部的作用更像是一个AI应用平台,而“豆包”是该团队开发的首款产品。目前,访问豆包官网的App下载链接后,用户会发现安卓和IOS版本均只提供Beta测试版的下载。
“豆包”的使用体验如何?
从“豆包”的名称和可爱的3D虚拟形象来看,字节并不打算打造一个像ChatGPT一样的“学霸”工具,而是希望推出一个更具亲和力的产品。
在进入默认界面后,可以看到“豆包”将页面划分为两部分,左侧展示了四个AI助手,分别是豆包、超爱聊天的小宁、英语学习助手和全能写作助手,而右侧则是与这些AI的对话框。
这四个AI助手之间有什么区别呢?
听听豆包的自我介绍——
总结而言,这四个助手各有特色——
豆包是班长,随叫随到;
超爱聊天的小宁是最佳同桌,幽默风趣;
英语学习助手是你的英语课代表,全面提升你的成绩;
全能写作助手则是语文课代表,助你文学素养飞跃。
不过,用户并非只能使用这四个默认的AI助手,正如在ChatGPT中可以创建新对话框一样,用户也能够新建对话框,甚至可以为新的对话起名或将其删除。
如果你向豆包询问:“豆包是什么?能做什么?”
随着ChatGPT的崛起,作为生成式人工智能的“豆包”与其他大语言模型相比,展现出哪些优势与劣势呢?
信息
接下来,让我们探讨一下“豆包”在“语言理解”方面的表现。
信息
当谈到中国古典名著“四大名著”时,“豆包”的回答相当准确,并且在理解小说的深度上展现出了良好的能力。
然而,在“总结”能力方面,“豆包”显得颇为诚实——它的准确度确实需要进一步提升。
例如,当我们随机提出一道数学题时:
信息
理应得到的答案是[0,1),即使经过重新作答,依旧给出了错误的结果……
信息
如果问题不涉及数学,结果又会如何呢?
信息
此时,它的回答是正确的!
此外,从评测结果来看,“豆包”仅能对“有科学依据”的问题做出有效回应。
信息
值得一提的是,“豆包”不仅支持中文对话,还能进行英文交流,用户只需点击右上角即可轻松切换语言。
信息
有传言称国产大型模型缺乏独立数据库,需大量依赖英语国家的数据进行训练。让我们通过切换语言来验证“豆包”是否也如此:
在讲笑话的能力上,“豆包”在中英文之间的表现不相上下。
字节大模型“豆包”正式发布,潜力无限
在无聊时,或许你会考虑与“超爱聊天的小宁”进行对话,那么它究竟能否成为一个理想的聊天伙伴呢?让我来进行一次测试!
小宁的“默认状态”就如同水豚一样,表现得相当稳定而严肃。但若你希望它改变风格,它总是能迅速适应。
作为一个全能的写作助手,它不仅能够根据需求创作诗歌,还具备阅读鉴赏的功能。
尽管《田间之歌》的诗句并不算特别优美,但奇妙的是,它竟在不到10秒的时间内完成了创作。
当我们向“英语学习助手”提出问题时,它的反应又如何呢?
我询问了“ban”和“interdict”两个词的差别,结果显示,“英语学习助手”的回答并非完全用英文。
如果你觉得英文回答难以理解,可以让它转换为中文,双语切换过程非常顺畅。
总体来看,“豆包”目前支持一些基础性的问答,但它的准确性尚有提升空间。
值得注意的是,目前“豆包”仅能生成文本,尚未具备图片生成功能。
另外,豆包目前并未连接互联网。根据字节官方的说明,其训练数据截至2023年,因此无法回答关于2023年的问题。
字节大模型“豆包”的背后故事
与其他国内互联网企业相比,字节在今年2月便开始组建大模型团队,但直到近期才推出首款产品“豆包”,可谓是历经波折。
字节在人工智能领域的投入早已开始。早在2016年,字节便建立了人工智能实验室AI Lab,专注于自然语言处理、机器学习和数据挖掘等研究领域。
然而,随着国内“大模型之战”的展开,字节却迟迟未公布任何底层大模型的进展。
反倒是6月,火山引擎抢先发布了名为“火山方舟”的大模型服务平台,为国内大模型公司提供算力及其他相关服务。
至于豆包的发布,字节大模型团队实际上已默默取得了不少进展。
在7月,名为BuboGPT的大模型在Github上线,这同样是字节跳动团队的成果。
BuboGPT是一款多模态大模型,能够将文本、图像和音频等多种输入进行整合,在处理图像和音频时展现出卓越的对话能力。
官网:
https://bubo-gpt.github.io/
BuboGPT最引人注目的特性在于听音辨位的能力。
快手AI进军短视频领域
在字节推出新产品的热潮尚未平息之际,快手这个老对手也开始行动起来。8月18日晚上,快手宣布其“快手AI对话”的安卓版本正式开启内测,而在此之前,该功能在8月初已经进行了小范围的测试。
值得注意的是,字节的产品是一个独立的应用,而快手则将AI对话直接融入到快手平台中,显示出其希望在应用层面抢占先机的决心。用户只需点击快手搜索首页右上角的AI图标,便可以轻松输入问题或选择引导性问题,迅速进入对话模式。
此外,用户还能够通过底部入口触发“搜索智能问答”卡片,以便更方便地使用这一功能。借助大模型的强大支持,用户将更高效地找到感兴趣的主播和视频内容。
快手AI对话是短视频直播行业中首个基于大型语言模型的应用产品。随着国内大模型的竞争愈发激烈,各大厂商不仅在底层模型方面不断努力,同时在应用层的争夺也已悄然展开。如今,AI大模型逐渐渗透到各种终端设备和广泛的国民级应用中。近期,华为与小米也已将大模型整合进自家手机系统中。
如今,“抖快”两大平台均已推出AI应用,标志着国内大模型应用落地的又一个重要里程碑。