Megatron-Turing NLG 的技术突破 近期,微软与英伟达联合发布的 Megatron-Turin…
深度求索(DeepSeek)太强了!这 3 个功能让效率翻倍! 一、多模态数据智能处理 深度求索(DeepSe…
分布式训练加速技术 华为盘古大模型的核心突破之一是其 超大规模分布式训练框架。通过独创的混合并行计算架构,模型…
BLOOM 模型的核心挑战 作为目前开源社区规模最大的多语言大模型之一,BLOOM 凭借 1760 亿参数和跨…
太乙秘籍与 AI 大模型的结合之道 在 AI 大模型快速发展的今天,如何高效利用工具提升模型性能成为开发者关注…
智源研究院 CPM 有多强?3 大神级功能彻底改变 AI! 模型规模突破传统框架 智源研究院推出的 CPM 大…
揭秘 WuDao 2.0 三大核心技术!AI 大模型训练效率突破天花板 动态计算架构:让算力分配更智能 WuD…