共计 1967 个字符,预计需要花费 5 分钟才能阅读完成。
AI 的各类比较分析
在《皇室战争》中,通用 AI 显然难以与人类选手抗衡
① 语言模型如同一根直肠子,过于依赖透明的全局信息,缺乏必要的博弈直觉,这导致其在面对风险决策时显得无能为力——人们之所以倾向于信任聊天机器人,正是因为它们表现得相对直率。
通用模型(例如 LLM)本质上是一种确定性的推理工具,擅长在信息充足、规则明确的环境中寻找最优路径。然而在《皇室战争》这类信息不完全、实时博弈及心理对抗的卡牌即时战略游戏中,AI 的保守本能却成为了其致命的短板。
——人类的强化学习反馈(RLHF)会改变通用模型的某些特性。例如,Claude 3.7 倾向于逃避对抗,它的关注点在于如何退出游戏,而不是采取斗争和策略;而 Gemini 2.5 Pro 则在压力下崩溃,表现出无助。这些特质使得通用模型在竞争中处于不利地位。
人类玩家常常通过诱骗对手施放法术来制胜——例如,先投放一张低费的小兵,迫使对方使用箭雨或滚木等范围法术,随后迅速跟进强力单位,组合皇家巨人和电法师。这种以小兵换取法术空档的策略实则属于心理博弈。
然而,通用 AI 在看到哥布林被箭雨清理的路径时,会简单地判断为负收益的操作,因此拒绝执行。它无法理解表面上的损失其实是战略投资的博弈逻辑。
除非经过大量对局数据与强化学习,专门训练“法术诱骗识别与反制模型”,否则 AI 始终只会选择“稳健发育”,最终被人类玩家摸清套路——哦,这个 AI 从不进行诱骗,那我就可以把法术留着,等待它出大单位时再出击。
费用节奏的博弈同样至关重要。《皇室战争》的核心在于圣水的节奏——双方每秒增加 1 点费用,最高上限为 10 点。高手会故意压制费用,制造费用上的优势窗口。而通用 AI 往往依据费用满了就出牌的机械逻辑行事,根本无法理解延迟出牌 = 制造信息差 + 扰乱对手节奏的高阶战略。
人类玩家只需观察 AI 前三局的出牌节奏,就能预判它在第四局的进攻波次,提前布防并进行反击,轻松逆转局势。
②《皇室战争》与围棋等明牌博弈有本质区别
信息迷雾 + 动态规则 + 卡组相克,构成了 AI 的噩梦
AlphaGo 之所以能够战胜围棋,是因为围棋是“完全信息博弈”——棋盘上的所有棋子均可见,规则稳定(落子无悔且无随机性),胜负完全取决于空间计算与长远规划。而《皇室战争》则是动态的非完全信息博弈,其复杂性远超围棋:
你无法得知对手的手牌(除非他们打出),也不知道对手的卡组结构(除非你经历过无数局的对战才能推测)。人类依靠“读牌”能力——根据对手前几秒的出牌习惯、流行的卡组趋势,甚至故意试探以推测对手的手牌。而通用 AI 缺乏这种“读牌直觉”,只能在对手出牌后做出反应,始终慢半拍。
游戏中存在复杂的克制体系。例如,矿工克制塔后的单位,塔克制坦克,而毒药克制人海。人类会根据对手的卡组灵活调整策略,甚至故意藏起某些卡牌,比如一直不使用大闪,以逼对手交出关键牌。通用 AI 缺乏这种克制链的推理能力,往往在对局中受到困扰。
围棋是解答静态棋盘上的数学题,而《皇室战争》则是动态战场上的心理战、资源战和信息战。通用 AI 连“战场迷雾”都无法透视,谈何博弈。
③ 其实并非 AI 无法胜过人类,而是成本太高——通用模型的“低泛化诅咒”,模型缺乏高阶的泛化能力,其通用性实际上只是表现在表达能力上,其他能力则是经过后期训练而获得的,涉及的人工成本和智能程度各不相同。
这并不是说 AI 根本无法击败人类。
要训练一个专用的《皇室战争》AI,需要:千万级的对局数据(必须标注卡组、出牌时机和胜负关键点)+ 定制化的神经网络架构(处理时序决策、卡牌组合与费用管理)+ 高强度的 GPU 集群持续训练数周。
而通用模型(如 GPT-5、Claude 4、Gemini)在此时的“低泛化能力”反而成为了拖累:它可以进行编码、聊天、搜索,因为在高价值领域经过特殊训练,但在面对“现在是否应该交出大闪”这种具体决策时,它缺乏专用模型的“肌肉记忆式”条件反射。
戴爵曾举办通用模型的棋类邀请赛,与专用模型相比,这种通用 AI…毫无竞争力,连明牌游戏都无法胜任,又如何应对暗牌游戏呢。
在《皇室战争》中,通用 AI 只会被顶尖的人类玩家以“遛狗式”的方式轻松击败。这并非智力问题,而是博弈基因的缺失加上专用训练的高昂成本。
我认为,有时通用 AI 就如同纸上谈兵,虽然言辞恳切,但实际上不懂得实操(实操需要针对性的后期训练,成本极高),在面对老练的玩家的诡计、节奏和心理压力时,只能被动应对,逐步陷入被动局面,最终失败。