Google最新发布的Gemini Diffusion：能否颠覆自回归模型，成为未来的主流？

没有评论

共计 1203 个字符，预计需要花费 4 分钟才能阅读完成。

谷歌的新型 LLM 扩散模型：一种更优雅的思维方式

谷歌推出的 LLM 扩散模型与以往的模型（如大型语言扩散模型）存在显著差异。该模型在生成 token 后，针对已有的 token 进行了细致的调整。有关这一点，可以通过发布的演示视频直观地了解。

在演示的第一帧中，生成的答案明显是错误的。

然而，到了第三帧时，系统成功生成了正确的答案。

在大型语言扩散模型中，扩散过程更像是多 token 预测。与这种多 token 预测相比，谷歌的 LLM 扩散模型展现出更为优雅的特性，更加贴近人类的思维方式。

我个人认为，扩散模型与下一个 token 预测在本质上是相同的。有关详细讨论，可参考以下文章：

卡卡罗特：从 ” 下一个 token 预测 ” 到扩散模型

无论是在训练的规模法则还是推理的规模法则中，二者都依赖于增加计算资源来接近“智能”这一目标。

下一个 token 预测的模式在某些方面的缺陷（从另一个角度看也可视为优点）在于，随着输入上下文长度的增加，其时间和空间的复杂度也会随之上升。

与此相对，扩散模式的一个优势（某种程度上也可视为缺点）在于，其空间复杂度是固定的，而时间复杂度则会随着迭代次数的增加而增长。

之前有朋友提到一个观点，可能在面对相同复杂问题时，两种方法的时间复杂度最终相差无几。我对此表示赞同。但我想补充的是，尽管两者的时间复杂度相似，扩散的并行计算方式可能更加适合 GPU 的运算，甚至有望找到更优的近似算法。因此，从这个角度来看，LLM 扩散模型仍然具有积极的意义。

最后，我一直在思考，是否有可能存在一种推理模型，其思考部分并非通过下一个 token 预测完成，而是采用类似谷歌的 LLM 扩散方式，持续精细调整固定大小的上下文。这样一来，就能够在有限的空间复杂度内不断增强时间复杂度。我认为现有的下一个 token 预测可能存在许多空间复杂度的浪费。而在思考结束后，再利用下一个 token 预测来输出最终答案。

分割线，顺便宣传一下我们最近的研究成果。

http://arxiv.org/abs/2505.15784

我们在数学上证明了，大型语言模型的训练过程可以视为对 Solomonoff 先验的可计算近似。而大型语言模型的下一个 token 预测正好可以视为 Solomonoff 归纳的可计算近似。

利用 Solomonoff 先验的数学特性，可以很好地解释上下文学习、少样本学习以及训练规模法则和推理规模法则。此外，我们还提出了一种选择少样本示例的技巧，以验证这一理论框架的合理性。

来源：知乎

原文标题：如何评价 Google 刚刚发布的 Gemini Diffusion? 会代替自回归模型成为下一代模型吗？– 知乎

原文链接：https://www.zhihu.com/question/1908479621466396378/answer/1908587805371798446

声明：

文章来自网络收集后经过 ai 改写发布，如不小心侵犯了您的权益，请联系本站删除，给您带来困扰，深表歉意！

正文完

LLM扩散模型生成模型自回归模型计算资源谷歌

发表至： AI大模型

2025-10-10

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

使用智语AI写作智能工具，您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章，还是创作引人入胜的故事，AI助手都能为您提供丰富的素材和创意，激发您的写作灵感。您只需输入几个关键词或主题，AI便会迅速为您生成相关内容，让您在短时间内完成写作任务。
利用AI智能写作工具，轻松生成高质量内容。无论是文章、博客还是创意写作，我们的免费 AI 助手都能帮助你提升写作效率，激发灵感。来智语AI体验 ChatGPT中文版，开启你的智能写作之旅！

1. DeepSeek APP隐藏功能你知道几个?这3个神技让效率翻倍!

2024最新国产AI大模型排行榜：前十名、应用与技术解析全在这里！

2024年国产AI大模型发展全景分析：龙头股、技术趋势与应用前景一览

2024年中国AI大模型发展现状与最新应用解析：谁才是行业的真正领军者？

探索AI大模型的无限可能-从个人使用到行业应用的全面解析

2024年中国人工智能大模型排行榜与应用开发实践深度解析

颠覆程序员价值的AI大模型：从技术现状到国内应用解析，全方位揭秘！

高校发文明确AI写论文的规范与界限，学术诚信面临新挑战！

深入解析 Gemini 2.5 Deep Think 的独特魅力与价值

GPT-5研发遇挫，2025年能否如期发布？揭秘背后问题！