✍️ Gate 广场「创作者认证激励计划」进行中!
我们欢迎优质创作者积极创作,申请认证
赢取豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000+ 丰厚奖励!
立即报名 👉 https://www.gate.com/questionnaire/7159
📕 认证申请步骤:
1️⃣ App 首页底部进入【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】进入认证页面,等待审核
让优质内容被更多人看到,一起共建创作者社区!
活动详情:https://www.gate.com/announcements/article/47889
Anthropic未发布的AI破解了Linux和OpenBSD多年来人类未发现的漏洞——比特币新闻
主要要点:
Claude Mythos AI在Cybergym上得分83% 并在每个主要浏览器和操作系统中发现关键漏洞
该模型,Anthropic描述为前沿AI历史上最大单一模型能力提升,于2026年4月7日完成训练并对外公布,此前在3月下旬通过一个配置错误的内容管理系统泄露了大约3000个内部文件的内部细节。
Anthropic未向公众或通过其通用API发布Claude Mythos预览。公司在模型展示出能以超越人类专家和之前AI系统的速度和规模发现并利用未知软件漏洞后,限制了访问权限,仅向经过审查的合作伙伴开放。
在网络安全基准测试中,Mythos与Claude Opus 4.6之间的差距难以忽视。Mythos在Cybergym上的得分为83.1%,而Opus 4.6为66.6%;在SWE-bench Verified上分别为93.9%和80.8%。在SWE-bench Pro上,Mythos获得77.8%,而Opus 4.6为53.4%,差距达24个百分点。在没有工具的“人类的最后考试”中,Mythos得分56.8%,而前一版本为40.0%。
该模型无需专门的网络安全训练即可发现这些漏洞。其提升源于在推理、多步骤规划和自主代理行为方面的更广泛进展。给定一个目标代码库在隔离容器中,它会读取源代码,形成关于内存安全缺陷的假设,编译并运行软件,使用Address Sanitizer等调试工具,按漏洞可能性对文件进行排序,并生成经过验证的漏洞报告和有效的漏洞利用证明。
其中一些漏洞利用几乎不需要人工指导。Tomshardware.com报道,一处27年的OpenBSD TCP SACK漏洞——一种微妙的整数溢出,允许攻击者通过构造恶意数据包远程崩溃任何响应的主机——在大约1000次运行后被自主发现,成本不到250万美元。一处16年的FFmpeg H.264漏洞在被Mythos发现前,经过超过五百万次自动化测试和多次审计。
浏览器测试方面尤为引人关注。在Firefox 147 JavaScript引擎测试中,Mythos生成了181个完整的shell漏洞利用和29个寄存器控制案例。Claude Opus 4.6在同一测试集上只生成了两个shell漏洞利用。该模型还构建了有效的Linux内核权限提升链,从用户到服务器的root权限,在筛选出100个最新的CVE后,筛选出40个可利用的候选,并成功利用了其中超过一半。
人类验证者审查了模型的198份漏洞报告,89%的严重性评级得到了认可,且在一个严重性等级内的认可率达98%。
Project Glasswing
目前已完全修补的漏洞不到已识别漏洞的1%。Anthropic正协调负责任的披露,公布未修补问题的加密SHA-3承诺,并遵循90天加45天的时间表,逐步披露完整细节。已披露的例子包括17年前的FreeBSD NFS服务器远程代码执行漏洞CVE-2026-4747,允许未认证的完全root权限。
与模型同时宣布的Project Glasswing,是Anthropic试图在类似工具广泛普及之前,将这些能力引导到防御领域的努力。创始合作伙伴包括亚马逊云服务、苹果、博通、思科、Crowdstrike、谷歌、摩根大通、Linux基金会、微软、英伟达和Palo Alto Networks。访问权限也在逐步扩展到40多个关键软件组织。
Anthropic承诺投入$4 百万美元用于开源安全捐赠:其中包括向OpenSSF通过Linux基金会捐赠的2.5百万美元给Alpha-Omega,以及向Apache软件基金会捐赠的150万美元。
公司承认,像Mythos这样的AI工具降低了发现和利用漏洞的门槛,并警示短期内国家行为者、中国、伊朗、朝鲜、俄罗斯以及犯罪团伙如果没有控制措施而广泛传播类似能力的风险。它描述了在防御者完全整合技术之前的过渡动荡期。
Anthropic表示,未来的Claude Opus版本将包括检测和阻止危险网络安全输出的安全措施,并计划引入一个由经过验证的安全专业人士组成的网络验证计划。预计在90天内发布合作伙伴的发现和修补漏洞的公开报告。