共计 4367 个字符,预计需要花费 11 分钟才能阅读完成。
在最近举行的 Devcom 开发者大会上,恰逢科隆国际游戏展,人工智能再次吸引了众多关注。
来自微软、腾讯、谷歌和 Meta 等国际知名企业的代表,带来了 超过 20 场与 AI 相关的主题演讲 ,内容包括“ 如何用 AI 提升游戏美术的生产效率”、“AI 工具如何与传统工作流程无缝对接”、“AI 在动画生成和场景构建方面的具体应用案例”,这些主题成为开发者们热烈讨论的焦点。
近年来,游戏美术对细致程度的需求呈现出指数级的增长,随之而来的则是工作量的几何级增加。
在此展会上,腾讯游戏首次向全球发布了其游戏创作的 AI 全链路解决方案 VISVISE。
该方案包含了一系列 AI 工具,分为动画制作、模型制作、数字资产管理和智能 NPC 等四大模块,覆盖了游戏美术开发的全流程,旨在辅助游戏美术师处理那些 重复性高、机械性强的繁重任务。
例如,在 3D 动画制作方面,VISVISE 的MotionBlink 工具可以根据用户输入的少量关键帧,自动生成中间帧,从而完成完整的序列动画。
以往,动画师手动补帧的工作量占据角色动画制作总工时的 60%-70%,而制作短短十秒的动画,手动精修可能需要 3 到 7 天。
如今,借助 AI 的自动补全功能,仅需 4 秒钟就能生成 200 帧动画:
同时,它还达到1.5 秒间隔的极限优化,部分效果甚至接近光学动捕的水平:
在体验了 MotionBlink 的功能后,一位来自德国的游戏开发专业学生表示,他正在开发独立游戏并考虑创业,而当前最大的瓶颈正是动捕技术。他认为,MotionBlink 能显著降低角色动画制作的门槛,为小型团队和创业者提供了极大的支持。
这仅仅是 VISVISE 中的一个 AI 工具,其他如 Superman 角色动画方案 和GoSkinning 自动蒙皮 工具也已在多款游戏中得到应用,例如GoSkinning 已经在《和平精英》和《PUBG Mobile》等热门游戏中得到使用。
那么,VISVISE 是如何构建的?腾讯开发这一解决方案的核心理念又是什么?接下来我们一探究竟。
游戏 AI 大模型解决的关键问题
在传统的游戏美术制作中,约 50%-60% 的时间都用于美术资产的创建,而3D 建模和动画制作是最繁琐的环节。
3D 建模的过程是将概念设计转化为“立体数字模型”,最终产生“静态数字模型”。要让角色具备运动能力,需要经过“骨骼绑定→蒙皮→动画制作”的流程。
设想一下,你正在为一个 3D 角色“穿衣服”——这并不是实际缝制布料,而是用数字化的方式,确保它的皮肤与骨骼之间完美协调。这正是游戏开发中既单调又至关重要的工作之一:蒙皮。
腾讯游戏效能产品部的陈冬 指出,当骨骼运动时,必须计算 3D 模型的每个面片(Mesh)随骨骼运动的程度,这涉及到确定每个面片与关节的关联及其权重。权重决定了面片受哪根关节影响及其影响程度,“如果某个面片只连接到单一关节,那么它只会受到该关节的运动影响。”
在传统流程中,美术师需要手动调整成千上万的“权重点”,就像用隐形的线将皮肤通过不同的权重数据缝合到骨骼上。靠近关节的皮肤需要分散绑定(权重分配),以确保角色抬手时,手肘的褶皱自然流畅。
然而,问题随之而来:
- 一个角色可能有上百根骨头,每根骨头都需精确控制皮肤的变形;
- 稍有不慎,衣物就可能出现“穿模”现象——例如内层衣物的运动幅度过大,直接刺穿外层。
即使是经验丰富的绑定师,也需耗费 60% 的时间来解决这些问题。
而在动画制作阶段,挑战变得更加复杂:
传统上有两种方式可供选择:“手 K”和“动捕”。手动逐帧调整动画(手 K)效率低下,一段十秒的动画可能需要调节整整一周 。虽然动作捕捉(动捕)速度较快,但 其数据质量不稳定,仍需进行大量修正。此外,风格化和非通用类型的动作,比如武术动作或夸张表情,常常因为缺乏数据储备而需额外组织动捕实验。
AI 希望解决这些难题,但由于游戏数据的复杂性,其前行步伐缓慢:
- 蒙皮需要建立模型顶点与骨骼的复杂关系,而 3D 数据的异构性使得 AI 表征成为难题;
- 动画的细节极为丰富,缺乏统一有效的表征(例如大语言模型的离散化表达),其空间和时序的多维建模同样充满挑战。
更重要的是,游戏行业的标准极其严格——AI 生成的内容必须能够无缝融入制作流程,并且要便于美术师随时进行调整。如果一家公司对游戏开发流程不够了解,或缺乏足够的数据,其 AI 很可能连“及格线”都无法达到。
因此,真正的挑战或许在于:如何让 AI 不仅懂技术,还能理解游戏?
腾讯游戏的解决方案
在蒙皮方面,腾讯游戏的 VISVISE 推出了 GoSkinning 蒙皮工具,通过 AI 的两阶段处理来解决蒙皮的难题:首先,利用 通用蒙皮 AI 大模型 (基于 GCN 和 Transformer 架构) 预测骨链和骨骼的权重 ,随后再通过 局部 AI 对效果不理想的区域 (如裙摆、翅膀等复杂部件) 进行二次优化。
操作过程十分简便,只需在场景中选择模型和关节,点击即可实现自动整体蒙皮。
在局部蒙皮方面,以下示例显示角色的裙摆出现了粘连问题,只需在场景中选择错误的关节和顶点,GoSkinning 就能针对局部问题进行一键修复:
在游戏研发的过程中,腾讯游戏利用高质量数据训练其系统,使得 2 万顶点模型的处理时间缩短至 30 秒,效率提升达到惊人的 8 倍。
同样,动画制作领域也因 AI 的进步而受到变革。腾讯游戏的 VISVISE 团队开发了 MotionBlink 工具,开发者只需设定角色在跳跃与落地等关键时刻的姿态,AI 便能借助自回归 Diffusion 模型 自动生成中间帧。其核心的 MotionGen 大模型,基于海量的高精度动捕数据,支持多种动作风格如攀爬与舞蹈,部分动作的生成质量已接近专业的动捕级别。
让我们来看一个具体的操作示例。首先,设定角色的运动路径:
接下来,添加一些关键帧,并调整角色的姿态:
然后,使用 MIB 智能补全中间帧:
几秒钟之内,一段完整的动画就此生成:
目前,团队在智能关键帧生成方面的研究 已被 ACM SIGGRAPH 2025 接纳。
更为重要的是,这些工具能够 以插件形式无缝集成到 Maya 等现有开发软件中,开发者无需重构工作流程即可调用。
腾讯游戏的技术研发与生产实践紧密结合,源自于其多年的一线开发经验。AI 技术团队深知:在游戏角色挥舞武器时,手腕需要旋转多大的角度;角色模型需要绑定多少个权重点,才能使裙摆呈现出最自然的动态效果。
VISVISE 的起源与发展历程
与其他“技术先行再找应用”的 AI 发展模式不同,VISVISE 是腾讯游戏 根据实际开发需求所创造的。
早在 2016 年,腾讯游戏就开始探索 AI 在游戏开发中的潜在应用,最初将深度学习技术应用于提升运营效率和优化流程;2017 年,团队则尝试利用强化学习进行游戏对战的相关研究;到 2018 年,技术研发的重点逐渐转向美术生产管线(DCC)领域。
2022 年,腾讯游戏发布了 AI 自动蒙皮工具 GoSkinning1.0 版本。这项技术通过数据驱动的方法,借助机器学习对已有蒙皮数据的特征进行分析,能够在相似的服装数据集上进行预测,实现骨骼与面片的智能网格蒙皮,已在《和平精英》《QQ 炫舞》等游戏中得到实际应用。
根据实际应用数据,仅 GoSkinning 1.0 版本就使得《和平精英》的动画蒙皮制作效率提升约 40%。
此后,VISVISE 团队与《和平精英》项目组保持密切合作,持续根据具体的开发需求提供定制化的技术功能。目前,GoSkinning 已经更新至 4.2 版本,新增了裙摆蒙皮、四足蒙皮及面部绑定等功能,动画蒙皮制作效率提升已超过 60%。
未来游戏 AI 的发展趋势
据陈冬的介绍,2023 年生成式人工智能迅猛发展,团队意识到,通过神经网络对大规模数据进行预训练,可以展现出卓越的生成能力。因此,他们决定加大对游戏开发中最昂贵的 3D 模型和动画生成领域的投资。
进入 2024 年,腾讯游戏开始 将分散的人工智能研究整合为系统化的产品矩阵,正式推出 VISVISE。
该系统围绕游戏创作的六个核心环节——模型生成、贴图制作、骨骼绑定、动画制作、场景构建与渲染,搭建了 动画制作、模型制作、数字资产管理和智能 NPC 四大 AI 生产管线。每个管线都配备了专门设计的 AI 工具,这些 AI 模型基于游戏行业的实际需求进行开发,并针对不同类型的游戏进行了差异化的训练。
在 2025 年的第一和第二季度,腾讯的财报持续强调了人工智能在提升研发效率方面的重要作用。其中,在第一季度中提到 AI 已对长青游戏起到了实质性的推动作用,而第二季度则指出《王者荣耀》和《和平精英》等顶尖产品在向平台化转型的过程中,增强了 AI 的应用力度。
如今,VISVISE 不仅服务于腾讯内部的游戏项目,还涵盖了众多行业合作伙伴,例如 GoSkinning 已成功应用于近百款游戏。
游戏 AI 的前景展望
随着 ChatGPT5 和 Google Genie3 的发布,逐渐形成了一种观点:多模态将成为人工智能技术发展的关键能力。而富有 2D 和 3D 交互场景的游戏,正是 AIGC 技术的最佳应用平台。那么,在这一趋势下,我们应如何理解游戏及其 AI 的能力和价值呢?
回顾人工智能的发展历程,游戏一直扮演着“试验田”和“加速器”的角色——正如腾讯游戏效能产品部负责人陈冬所说:“游戏与 AI,天生就是一对理想伴侣。”
例如,英伟达的显卡最初是为游戏渲染设计的,但如今却成为了训练大型模型的计算基础;而 DeepMind 在训练强化学习 AI 时,第一个“陪练”选择的便是《星际争霸》和《DOTA2》。甚至在硬件层面,负责游戏处理的 CUDA 核心和 AI 运算的 Tensor 核心,物理位置上如此接近,仿佛是命中注定的“邻居”。
这种密切关系并非偶然,而是技术发展必然结果。
游戏中的“感知环境→决策→反馈→迭代”过程,本质上就是 AI 训练的理想场所。比如,一个 AI 在《王者荣耀》中掌握了“蹲草埋伏”的技巧,与在现实世界中学习“预判交通”的逻辑,其底层思路或许并无二致。
同时,游戏也是对 3D 资产需求极大的重要场景。然而,更为关键的是,游戏对“极致体验”的追求,不断推促着人工智能的极限突破。早年,开发者梦想创造“会哭会笑的 NPC”,但因技术限制只能设计成“木头人”;如今,AI 能够让 NPC 记住玩家的名字、评论他们的操作,甚至假装生气——但这还远远不够。
陈冬指出,他们最渴望的突破是智能 NPC 的创新。
现在的 NPC 更像是“打补丁”的机器人:增加记忆模块、加入情感计算,但本质上仍在“按剧本演出”。
真正的突破在于,让 NPC 能够像人类一样“理解”虚拟世界——例如,它能够识别“玩家刚才的话是在开玩笑”,而不是机械地回应“指令无效”。
尽管这项任务极具挑战性,但游戏的魅力恰恰在于此:它既是人工智能的“考场”,也是“灵感源泉”。或许有一天,游戏中的 NPC 会率先达到 AGI——毕竟,它们在虚拟世界中扮演人类角色已久。
本文摘自微信公众号“量子位”(ID:QbitAI),作者:西风,经 36 氪授权发布。