共计 1022 个字符,预计需要花费 3 分钟才能阅读完成。

经济观察网 记者 任晓宁 实习生 谭玉清
8 月 17 日,字节跳动宣布其首款 AI 对话产品“豆包”进入外部测试阶段。次日,该项目组的成员向经济观察网阐述:“豆包”是一款聊天机器人,现处于早期的开发验证阶段,此次上线为小规模邀请测试。当前测试阶段的“豆包”仍然存在诸多限制,生成内容的准确性也可能不够高,期待测试用户的反馈以不断优化产品。
根据备案信息,“豆包”由北京春田知韵科技有限公司负责。天眼查数据显示,该公司注册资本为 100 万元,法定代表人是严林,成立于 2023 年 7 月 26 日,并由北京抖音信息服务有限公司全资拥有。
记者访问“豆包”官网后,下载 APP 即可体验,用户可通过手机号或抖音账号登录。在“豆包”的自我介绍中,它提到自己是一个大型语言模型,能够进行问答、文本生成和语言翻译等多项任务。它可以根据用户的需求及上下文进行自适应的问答,提供个性化服务。
与百度的文心一言、阿里的通义千问等大模型产品相比,“豆包”有一个显著特点,即默认使用语音输入并以语音进行回应,增强了聊天的互动性。
不过,从聊天体验来看,“豆包”的智能性尚显不足。尽管它声称能与用户进行幽默的对话,记者询问:“你有多风趣?”它的回答却是:“哈哈,我也不太清楚呢。”
在阅读理解方面,“豆包”对特定主题的回答表现尚可,其理解和归纳能力不错。但与文心一言相比,“豆包”在知识广度与逻辑深度上稍显不足。
针对一些主观性较强的问题,它的回答通常围绕特定词汇的意义展开,效果并未达到预期。例如,当被询问关于广东省 2022 年高考作文的主题——结合“本手、妙手、俗手”在围棋中的应用,以及对人生的思考时,豆包的回答仅局限于对三个关键词的解释,相比之下,文心一言会结合更丰富的事理和实例进行回应。
(豆包与文心一言在高考作文方面的不同回答对比)
在常识问答方面,“豆包”能够提供基本的生活常识,但面对深入的问题则显得力不从心。例如,当被问及中国古典四大名著及其作者时,它给出了正确的答案。然而,若进一步询问小说中的主要人物的经历和思想情感时,它难以结合自身的理解作出分析。
此外,在数学计算方面,“豆包”能够处理一些基础的数学运算以及编程设计任务。