共计 499 个字符,预计需要花费 2 分钟才能阅读完成。
DeepSeek 3.1 与 Gemini 2.5 Pro 的比较分析
依据 SWE-bench verified 这一关键指标,DeepSeek 3.1 与 Gemini 2.5 Pro 的表现相当,都未能达到 OpenAI 和 Anthropic 的顶尖水平。
假如 Gemini 进行新一轮的更新升级,它们的综合实力将有可能超越 DeepSeek,直追 OpenAI。
就广泛适应性而言,DeepSeek 的表现则显得较为逊色,原因在于其模态多样性不足,数据覆盖面有限,强化学习的调优无法规范化,甚至还依赖于 Gemini 的数据进行蒸馏。基础较弱的情况下,开启 Reason 功能几乎没有实质意义。而 A 社的底层技术强大,即使不启用 Reason,依然能够展现出色的性能。
在应用层面,DeepSeek V3.1 主要被看作是一款以编程为主的模型。
来源:知乎
原文标题:DeepSeek V3.1 开深度思考之后是否强于 Gemini 2.5 Pro? – 知乎
声明:
文章来自网络收集后经过 ai 改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完