某科技巨头斥资百亿训练AI大模型,2025年上线即爆出重大安全漏洞!

共计 2408 个字符,预计需要花费 7 分钟才能阅读完成。

某科技巨头斥资百亿训练 AI 大模型,2025 年上线即爆出重大安全漏洞!一

文章目录CloseOpen

百亿模型翻车现场

2025 年 3 月,代号“智穹”的 AI 大模型 在万众瞩目下上线了。这家科技巨头砸了上百亿,用了据说能绕地球好几圈的数据量,训练了整整两年,就指着它成为行业新标杆。结果呢?上线刚过午饭点,安全团队就炸锅了——后台警报响得跟过年放鞭炮似的。用户随手问了个“帮我写份保密协议”,模型输出的文档里,竟然夹带了训练时用的某银行真实客户交易片段!更离谱的是,有人测试模型的多步推理能力,让它规划个“从 A 城到 B 城的高效物流路线”,结果模型直接把某物流公司内部服务器的访问路径(带测试账号密码那种)给“推理”出来了。这哪是智能助手,简直是数据黑洞。

安全漏洞三重奏

这次捅的篓子,可不是单一问题,而是几个大雷连环爆:

  • 训练数据残留与泄露: 百亿级参数模型“吃”进去的海量数据,在“消化”过程中没清理干净。那些本该被脱敏或剔除的敏感信息片段(如个人身份证号片段 1990-2005 年出生人群的统计样本、未完全抹去的商业合同关键条款),竟然被模型“记住”并在特定诱导性提问下,像拼图一样“吐”了出来。安全专家发现,问题出在数据清洗环节的一个自动化脚本存在逻辑漏洞,导致约 0.03% 的敏感数据逃过了过滤网。
  • 依赖库的“定时炸弹”: 为了赶进度,“智穹”的核心团队大量使用了第三方开源 AI 组件库。事后溯源发现,其中一个用于处理序列输入的流行库,存在一个潜伏了近两年的高危提权漏洞(CVE-2024-xxxxx)。攻击者利用这个漏洞,通过精心构造的输入流,就能在模型推理过程中触发异常,获得部分系统级操作权限,进而窃取模型参数或干扰服务。巨头自己的渗透测试居然漏掉了这个点,实在不应该。
  • API 接口的“不设防”: 为了展示模型的强大交互能力,上线时开放了非常灵活的实时多轮对话 API。其访问控制机制存在严重缺陷:
  • 对用户输入的复杂性检查不足,导致攻击者可以注入大量精心设计的“越狱”提示词(Jailbreak Prompts),绕过模型内置的安全护栏。

    不同用户会话间的隔离失效,出现了罕见的“串台”现象——用户 A 的隐私对话片段,竟然出现在了用户 B 的回复上下文里。

    某科技巨头斥资百亿训练 AI 大模型,2025 年上线即爆出重大安全漏洞!二

    * 速率限制形同虚设,被黑客轻易发起海量恶意请求进行模型“探测”或“投毒”。

    漏洞类型 具体表现 影响范围
    数据残留泄露 输出含敏感训练数据片段 首批 10 万注册用户,涉及金融、医疗样本
    第三方库漏洞 CVE-2024-xxxxx 提权漏洞 模型推理服务核心节点
    API 设计缺陷 越狱、串台、拒绝服务 所有 API 接入渠道,持续约 3 小时

    行业地震波

    “智穹”的翻车,就像往滚油锅里泼了瓢冷水,整个 AI 圈都炸了。那些排队等着接入 API 的企业客户,脸都绿了,尤其是金融和医疗行业的,连夜开会评估风险。监管机构反应快得吓人,不到 24 小时,就发函要求全面停服整改,还启动了独立调查。最讽刺的是,竞争对手一边发声明表示“震惊和关切”,强调自家模型的安全性,一边技术团队疯狂加班,翻箱倒柜检查自己的系统有没有埋着同样的雷。社交媒体上,“# 百亿模型变泄密王 #”、“#AI 安全裸奔#”瞬间冲上热搜。用户们都在问:我们上传的数据,会不会成了下一个训练样本?下次泄露的会不会是我的聊天记录?大模型这玩意儿,能力越强,捅娄子的时候是不是也越吓人?安全问题,真不是砸钱堆参数就能解决的。


    要是你正好在 "智穹" 刚上线那会儿就注册了账号,特别是挤进前 10 万名的用户,真得打起十二分精神。最危险的就是那些使唤过 AI 写保密协议、生成合同文档的,或者让它规划过物流路线、计算运输成本的——比如那天有人随口问了个 "A 城到 B 城怎么送货最快",结果模型直接把人家物流公司服务器的门牌号和备用钥匙(测试账号密码)都吐出来了。这种骚操作可不止一例两例。

    赶紧翻翻 3 月 15 号到 16 号的聊天记录,重点盯着带 "银行"" 转账 ""物流单号"" 服务器地址 " 这些字眼的回复。要是看到文档里莫名其妙夹着陌生人的账户尾号,或者冒出根本不该存在的 XX 物流内部路径图,八成就是中招了。当然最直接的还是查收件箱,官方要是给你发了标着 [紧急安全通告] 的红头邮件,别犹豫立刻点开看详情。

    某科技巨头斥资百亿训练 AI 大模型,2025 年上线即爆出重大安全漏洞!三

    这次漏洞具体泄露了哪些敏感信息?

    根据调查,泄露内容包括银行真实客户交易记录片段、物流公司内部服务器访问路径(含测试账号密码),以及训练数据中未脱敏的个人信息片段,如 1990-2005 年出生人群的身份证号片段和商业合同关键条款。

    为什么百亿级大模型会出现这种低级漏洞?

    核心原因有三点:数据清洗环节的自动化脚本漏洞导致 0.03% 敏感数据残留;为赶进度直接使用存在 CVE-2024-xxxxx 漏洞的第三方开源库;API 设计时过度追求交互灵活性而忽视基础访问控制,如会话隔离失效和速率限制缺失。

    普通用户如何判断自己是否受影响?

    首批注册的 10 万用户风险最高,特别是使用过文档生成和路径规划功能的用户。立即检查 3 月 15-16 日使用记录,若发现模型返回过包含银行 / 物流字段的异常内容,或收到官方安全通告邮件,则可能涉及数据泄露。

    涉及 1990-2005 年出生人群的数据泄露有何风险?

    该年龄段泄露的身份证号片段虽不完整,但结合其他信息可能被用于身份推断。黑客可通过拼凑出生日期段(1990-2005 年)和地域代码实施精准诈骗,尤其需警惕假冒社保、银行等机构的钓鱼攻击。

    企业用户现在还能信任 AI 大模型 吗?

    短期内需谨慎评估,采取三重防护:业务系统与模型 API 间增设敏感词过滤网关;核心业务拒绝使用实时多轮对话接口;定期要求服务商提供第三方安全审计报告,特别关注训练数据溯源记录。

    声明:本文涉及的相关数据和论述由 ai 生成,不代表本站任何观点,仅供参考,如侵犯您的合法权益,请联系我们删除。

    正文完
     0
    小智
    版权声明:本站原创文章,由 小智 于2025-05-31发表,共计2408字。
    转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
    使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
    利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
    评论(没有评论)
    利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!