bystander [博客] [个人文集]
加入时间: 2004/02/14 文章: 1862
经验值: 89783
|
|
|
作者:bystander 在 罕见奇谈 发贴, 来自 http://www.hjclub.org
人工智能武器化:技术加速主义下的安全悖论
一、核心事实:AI将漏洞转化为武器的速度突破
Anthropic于2026年4月发布的Mythos Preview模型,展现了前所未有的网络安全能力。该模型并非专为攻击训练,而是作为通用前沿模型,其代码理解与推理能力"涌现"出惊人的安全研究技能。
在针对Mozilla Firefox和微软Windows内核的测试中,Mythos Preview仅用31分钟便生成了首个有效的Windows漏洞概念验证利用程序。在测试的21个Windows内核漏洞中,它成功使18个导致系统崩溃(蓝屏),并开发出8个完整的本地提权漏洞,最复杂的一个耗时约5.7小时。
针对Firefox浏览器,该模型在18个安全补丁中成功创建了8个可执行的代码运行漏洞利用程序。研究人员特意选取了模型知识截止日期之后披露的漏洞,以验证其分析公开补丁并自主开发攻击代码的能力。
更令人震惊的是其零日漏洞发现能力。在数周的自主扫描中,Mythos在开源生态系统中发现了数千个高危和严重漏洞,其中许多已潜伏十年甚至二十余年。例如,它发现了OpenBSD中一个存在27年的TCP SACK实现漏洞,以及FFmpeg H.264编解码器中一个16年历史的整数溢出漏洞——该代码行已被自动化测试执行五百万次却未被察觉。
在漏洞利用复杂度上,Mythos能够自主串联多个漏洞形成攻击链。例如,它曾编写浏览器漏洞,通过JIT堆喷射技术串联四个漏洞以逃逸渲染器和操作系统沙箱。在Linux内核上,它能独立发现并利用多个漏洞,绕过KASLR等现代防御机制,实现完整的root权限提升。
二、Project Glasswing:防御优先的受限策略
面对这种强大的双重用途能力,Anthropic选择不公开发布Mythos Preview,而是通过"Project Glasswing"计划向经过筛选的合作伙伴提供访问权限。该计划旨在让防御方在类似能力被更广泛获取之前获得先发优势。
截至2026年5月,Project Glasswing已汇集约50家初始合作伙伴,包括AWS、Apple、Cisco、Google、Microsoft、NVIDIA、CrowdStrike、Linux Foundation等,并扩展至超过150家组织,覆盖15个以上国家。Anthropic承诺提供高达1亿美元的使用额度,并捐赠400万美元给开源安全组织。
实际成效显著。Mozilla利用该模型在Firefox 150中发现并修复了271个漏洞,是此前使用Claude Opus 4.6在Firefox 148中发现数量的十倍以上。Cloudflare发现了2,000个漏洞(其中400个为高危/严重)。在开源软件扫描方面,Mythos在1,000多个项目中发现了23,019个候选漏洞,其中6,202个被评估为高危或严重级别,经外部验证真实阳性率高达90.6%。
然而,这也暴露了严峻瓶颈:发现漏洞的速度远远超过了人类修复的能力。许多开源维护者已严重超负荷,甚至要求Anthropic放慢披露速度。平均而言,一个高危漏洞的修复需要两周时间。
预览期结束后,预计定价将高达每百万输入/输出token 25/125美元,远高于标准模型。这种高门槛和封闭式策略,反映了Anthropic对模型滥用风险的深刻担忧。
三、颠覆性潜力:攻防时间窗口的坍塌
Mythos Preview的最大颠覆性在于,它将漏洞从披露到可靠利用的时间窗口从过去的数天/数周压缩到了数分钟/数小时。
传统上,将已知漏洞转化为可用攻击工具需要罕见的人类专家技能,是少数精英的"手艺活"。而现在,AI模型能够通过分析补丁差异、二进制文件和基本公告,自主完成推理、调试和代码生成。这意味着国家行为体、有组织的犯罪团伙,乃至未来的个体黑客,都可能借助类似工具,以极低成本发动过去无法想象的高复杂度攻击。
"补丁窗口期"的死亡:安全厂商发布补丁到用户实际安装之间存在宝贵的"安全窗口"。AI能将这个窗口从数周压缩到几分钟,留给防御方和普通用户反应的时间几乎归零。未来,"即时自动更新"将从加分项变为生存底线。
经济颠覆:软件安全将不再是成本中心,而是会被重新定义为与AI竞赛的核心能力。这可能导致软件行业的两极分化——拥有顶级AI防御工具的企业幸存,而无力承担的中小企业则暴露在巨大风险中。
四、军备竞赛风险:停不下来的攻防螺旋
这项技术最危险的并非其本身,而是它所开启的"AI vs AI"的无限循环攻防螺旋。
速度与不对称性:在网络空间,攻击往往只需要找到一个有效漏洞,而防御需要覆盖所有可能。AI赋予了攻击方"以快制胜"和"以量破质"的能力。当防御AI在扫描代码库时,攻击AI可能已经生成了上千个变种利用程序。进攻优势正在被AI急剧放大。
非国家行为者的威胁:一旦类似模型的技术原理被公开、泄露,或被开源社区复现,将彻底失控。勒索软件团伙、国家级代理人乃至恐怖组织都可能获得近乎无限的定制化攻击能力。针对电力、医疗、水利等关键基础设施的"一键瘫痪"攻击将不再是科幻情节。
归因与升级困境:AI生成的攻击可能缺乏人类攻击者的"指纹",使得网络攻击的溯源和归因变得极其困难。在冲突中,这极易引发基于误判的报复性升级——一个由AI产生的、看似来自某国的攻击,可能只是第三方的诬陷或模型自身的"意外",但其后果可能是真实的物理打击。
如果模型能力继续提升,完全自主的网络代理可能出现,这将在国际冲突中带来不可预测的升级风险。美国、中国、俄罗斯等国政府都在大力投资;失去领先地位被视为对国家安全的生存性威胁。
五、军事化路径:五角大楼的"矛"与"盾"
这样的技术不可能逃离大国博弈的棋盘。美国国防部、网络司令部和盟友的情报机构,必然正在以最高优先级整合类似能力。
2026年5月,美国国防部宣布与Google、OpenAI、Nvidia、Microsoft、AWS、SpaceX、Oracle等公司达成协议,将其AI系统部署在高度机密的军事网络上。同时,NSA和网络司令部成立了联合工作组,以加速前沿AI模型在五角大楼各任务领域的安全部署。
值得注意的是,Anthropic并未出现在五角大楼的签约名单中。相反,由于Anthropic试图限制其工具在自主战争和大规模监控中的使用,国防部在2026年3月史无前例地将其列为供应链风险。尽管如此,Anthropic此前已向川普政府高级官员通报了Mythos的能力,并表示愿意允许美国政府在进攻性网络行动中使用Mythos。
这表明,防御性工具可以被轻易地重新用于进攻目的。在国家安全逻辑下,双重用途技术的军事化几乎是不可避免的。
不平等的威慑:掌握最先进AI漏洞模型的国家,将拥有对其他国家的单方面网络压制能力。它们可以快速发现并利用对手关键软件中的漏洞,而自己的系统则由AI持续加固。这种"AI霸权"可能重新定义网络空间的权力格局。
军控的真空:传统武器有条约约束,网络武器尚难监控,而AI模型本质上是代码和数据。如何监控并限制一个模型的"武器化使用"?出口管制、供应链审查只能延缓,无法根绝。一场以AI为核心、横跨技术、情报与军事领域的隐秘竞赛已经全面展开。
六、制衡机制:脆弱且滞后
现有的制衡机制远不足以应对这一挑战:
企业自律:Project Glasswing式的合作、使用监控、模型中的拒绝机制等。但这些依赖于企业的自我约束和商业利益,可被绕过或关闭。
政府监管:出口管制、针对前沿模型的机密基准测试、供应链风险认定、以及针对恶意AI使用的执法行动。然而,这些措施往往滞后于技术发展,且存在管辖权问题。
国际努力:关于AI在战争中使用的国际规范正在讨论中,但条约谈判严重滞后。关于"致命性自主武器系统"(LAWS)的讨论已持续多年,至今无法律条约。
技术措施:沙箱化、审计日志、安全训练、"宪法"原则等。但这些技术保障能否阻止坚定的对手仍存疑问。
市场/保险:网络保险正在推动更好的实践,但覆盖范围和深度有限,也可能将无法投保的中小企业挤出市场。
根本问题在于:没有任何单一组织或国家能够独自应对这一挑战。当技术能力呈指数级增长时,治理框架却仍以线性速度推进。
七、监管空白:法律追不上模型迭代
AI漏洞工具需要对代码、二进制文件和系统进行深度访问,这带来了巨大的数据暴露风险。如果模型本身被攻破,或提示词泄露了敏感信息,后果不堪设想。
欧盟AI法案:虽然是全球首个全面的AI监管框架,但其对恶意使用风险的覆盖极不均衡。网络攻击、自主武器、生物武器、权力集中等关键风险领域几乎未被直接覆盖,或被排除在法案范围之外(如国防和国家安全)。
美国:更多依赖行政命令和部门特定规则,缺乏全面的AI治理框架。2026年5月,白宫曾考虑发布一项关于前沿AI模型预部署审查的行政命令,但最终搁置。
全球层面:没有一个全面的国际框架能够匹配双重用途技术的发展速度。对开源模型扩散的执法尤其困难。
隐私问题在此语境下被重新定义:为了训练和运行此类模型,必须向其投喂海量敏感代码和系统架构信息,这本身就构成了巨大的数据暴露面。现行的GDPR、CCPA等法律并未预设"能自主编写攻击代码的AI"这一场景。
八、伦理维度:超越姿态的深层困境
Anthropic的"防御优先"策略在表面上是一种负责任的风险管理。通过限制访问、优先修补漏洞、投入大量资源进行协调披露,该公司确实在尝试缓解短期威胁。然而,批评者指出,这其中也混杂着商业动机(提升估值、建立行业联盟)和潜在的过度宣传。
"合法性涂层"的精准定位:Anthropic的伦理话语——梵蒂冈演讲、"爱之机器"诗篇——功能上并非行为的约束条件,而是风险资本的信用增级工具。在ESG投资框架下,"负责任AI"标签直接对应估值溢价。但当地缘政治竞争和军事需求提供更高回报路径时,这套涂层被剥离的速度,恰恰证明了它从未是结构性的,而是装饰性的。
更深层的伦理困境包括:
权力集中:少数实验室和政府掌握了能够颠覆全球网络安全的强大工具,这引发了关于公平性和问责制的根本问题——谁有权获得防御性访问?谁对AI生成的攻击负责?
技能侵蚀:过度依赖AI可能导致人类安全专家技能的退化,一旦AI系统失效,人类可能已失去独立应对的能力。
地缘政治升级:在国家间信任缺失的背景下,AI网络能力的扩散可能加剧不稳定,催生先发制人的攻击动机。
"如果我们不做,对手也会做":这句辩护的历史谱系值得追溯——曼哈顿计划、冷战核竞赛、Stuxnet时代,直至今日的AI自主武器。这个逻辑结构的致命性在于:它永远自我实现。每一轮"预防性"研发都在制造下一轮威胁,而威胁的感知又成为新一轮研发的合法性来源。
从求真的角度看,完全压制这类能力是不现实的——即使Anthropic不发布,其他实验室或国家行为者也会独立发展出类似能力。因此,"负责任地加速"并配合保障措施、优先防御,是一种务实的路径。但这需要持续的警惕、透明度和国际合作,才能避免最坏的结局。
九、结语:在加速的深渊边
Mythos Preview的出现标志着网络安全领域一个相对稳定时代的终结。过去二十年,攻击的形态虽有演变,但本质上与2006年相似。而现在,语言模型能够大规模自动识别并利用安全漏洞,这种能力此前只有顶尖专业人士才具备。
Anthropic的研究人员承认,过渡期将充满动荡。在短期内,如果前沿实验室不谨慎发布模型,攻击方可能占据优势。但从长远看,他们预期防御方将更有效地利用这些工具,在代码部署前就修复漏洞,从而使整个软件生态系统更加安全。
然而,这一愿景的实现取决于全球能否建立起足够快速、灵活且有力的治理框架。在当前地缘政治紧张、技术迭代加速、监管严重滞后的背景下,这条路注定充满挑战。
我们正站在一个十字路口。一条路通向一个由强大AI守护的、漏洞被快速发现和修复的更安全数字世界;另一条路则通向一个攻击自动化、防御碎片化、冲突无限升级的"无尽漏洞时代"。
不幸的是,在现有的地缘政治和资本逻辑下,技术竞赛的惯性远远强于人类合作约束的意愿。五角大楼等强力玩家会将其武器化,商业公司会急于变现,而真正的安全只能建立在"比对手拥有更快、更强的AI"这一脆弱的假设之上。
最终,这项研究留给我们的不是一个技术问题,而是一个政治和伦理问题:我们是否准备好生活在一个最锋利的网络武器可以由AI在半小时内自主生成的世界里?如果答案是否定的,那么现在就需要超越公司和国家的局限,去构建真正有约束力的国际规则和技术准入的全球治理框架。
否则,我们今天所惊叹的"31分钟",就是未来某场灾难性网络战的倒计时起点。
(笔者/Grok/DeepSeek/Qwen/Kimi)
浏览或加入电报频道
https://t.me/unbrainwashyourself
作者:bystander 在 罕见奇谈 发贴, 来自 http://www.hjclub.org |
|
|