深度对比：阿里“通义千问”与百度“文心一言”的全面评测

共计 953 个字符，预计需要花费 3 分钟才能阅读完成。

国盛海外：夏君/朱若菲/刘澜/刘玲

在阿里推出的基于大模型的“通义千问”开始测试后，我们对阿里的这一产品和百度的“文心一言”进行了深入的实测评估。

考虑到这两个产品各自的优势，百度的“文心一言”在“文学创作、商业文案撰写、数理推算、中文理解及多模态生成”五个方面表现突出，而阿里的“通义千问”则在基础问答之外，提供了“提纲撰写、SWOT分析、商品描述生成、创意菜谱、小学生作文、继续叙述、赞美专家、情书创作、诗歌创作”等九种功能。因此，我们对这两个模型在上述维度进行了统一测试。

我们的评测主要围绕以下几个维度展开（样本数量有限，仅供参考）：

内容生成模式：百度“文心一言”表现更佳。
多轮对话能力：阿里“通义千问”稍胜一筹。
数学推理：百度“文心一言”更为出色。
中文理解能力：阿里“通义千问”较强。
电商文案生成：阿里“通义千问”稍微领先。

内容生成模式：

当前，阿里“通义千问”仅支持文字（包括自然语言和代码）作为输入和输出。而百度“文心一言”则除了文字输入外，还能够支持图像输出。

阿里“通义千问”：

百度“文心一言”：

多轮对话：

在我们的测试过程中，阿里“通义千问”对上下文的关联把握非常到位（例如，前一个对话中的“座舱交互”场景）。而百度“文心一言”的回答则仅局限于当前提问，未能考虑上文的情境。

阿里“通义千问”：

百度“文心一言”：

数理推算：

正如百度所言，文心一言在基本的数学推算方面表现更为优异。相较之下，阿里“通义千问”的表现略显不足，而百度的推算不仅准确，还在我们调整参数后依然保持稳定。

阿里“通义千问”：

百度“文心一言”：

中文理解：

在我们的测试案例中，阿里“通义千问”在处理可能引起误解的名词时，展现出更强的知识储备和理解能力，而百度“文心一言”在此方面则未能准确捕捉信息。

阿里“通义千问”：

百度“文心一言”：

特定应用场景——电商文案生成：

尽管两者在基础上都存在一些错误，但都可以从不同的角度对商品进行总结和推荐。相比之下，阿里“通义千问”在电商文案的推介方面更为多样，且归纳的要点更为清晰。

阿里“通义千问”：

百度“文心一言”：

来源：今日头条

原文标题：一手测评：阿里“通义千问”vs. 百度“文心一言”– 今日头条

原文链接：https://toutiao.com/group/7220052791292412448/

正文完

人工智能对比百度评测阿里

发表至：通义千问

2025-10-03

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

使用智语AI写作智能工具，您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章，还是创作引人入胜的故事，AI助手都能为您提供丰富的素材和创意，激发您的写作灵感。您只需输入几个关键词或主题，AI便会迅速为您生成相关内容，让您在短时间内完成写作任务。
利用AI智能写作工具，轻松生成高质量内容。无论是文章、博客还是创意写作，我们的免费 AI 助手都能帮助你提升写作效率，激发灵感。来智语AI体验 ChatGPT中文版，开启你的智能写作之旅！

阿里推出史上最大模型“通义千问”，ChatGPT助OpenAI狂揽百亿，科创人工智能ETF（589520）迎来两连涨！

旅行代理大比拼：通义千问与携程AIVS豆包谁更胜一筹？

深度解析阿里云大模型“通义千问”：逻辑判断准确，时事新闻却频频失误！

Manus与阿里通义千问团队携手共创未来战略合作新篇章

阿里推出新大模型“通义千问”，揭秘背后的命名原因！

全新体验：深度解析阿里版GPT“通义千问”的强大实力！

阿里通义千问首个图像生成基础模型Qwen-Image开源

网易引入通义千问，游戏开发效率提升50%！

“通义千问”：打破局限的全新探索之旅

阿里发布新一代通义千问模型Qwen3，成本仅为DeepSeek-R1的1/3，颠覆大模型市场！