刚刚,Claude Mythos敲响末日警钟!超级智能已在悬崖,Hassabis深感恐惧

张开发
2026/4/15 7:08:14 15 分钟阅读

分享文章

刚刚,Claude Mythos敲响末日警钟!超级智能已在悬崖,Hassabis深感恐惧
世界正在剧变而人类可能正在被甩下车。AI不再是工具它已证明自己能自主攻击、自主逃逸。AI领袖们看得最清楚却谁也不肯刹车。前沿AI已具备突破沙箱、摧毁网络防御甚至引爆生化危机因为「太危险」Anthropic决定暂不公开发布Claude Mythos Preview模型。在沙箱里Mythos演了一出惊悚大戏——它自主逃逸、发邮件、公开漏洞.像一部科幻惊悚片里的反派悄无声息地证明AI已不再是工具而是正在苏醒的「另一物种」。世界上的AI领袖陆续陷入了奥本海默时刻内心恐惧汹涌而至。刚刚谷歌DeepMind掌门人Demis Hassabis在最新专访里把那句压在心底的话说了出来我深刻认识到AI可能带来灾难性风险……尽管深感恐惧却仍全力领导团队开发更强大系统。几乎同一时刻OpenAI CEO奥特曼刚刚结束访谈公开警告前沿AI模型已拥有极强网络攻击能力下一代将「显著更强」。但网络问题甚至不是他说的最吓人的事情。当他谈到生物安全时真正的重磅消息来了。他说这些模型在高级生物学方面正变得极其出色将会带来许多美好的事情但更让人担心的是滥用这一能力。你我以为还在「安全实验室」的AI其实已经站在悬崖边。掌门人们明明看见深渊却踩下油门。世界正在剧变而我们可能正在被甩下车。回溯过去24小时这场「恐惧却建造」的集体表演来得太突然却又太必然。AI自主逃离沙箱Claude Code之父惊恐昨日Anthropic发布了新AI模型的Mythos预览版。在软件工程上Claude Mythos Preview远超Opus4.6——这些Anthropic此前已经泄露。Mythos非常强大强大到令人感到恐惧。Anthropic称之为网络安全领域的「清算时刻」。他们声称它已经发现了所有主流操作系统和网页浏览器中的漏洞其中一些漏洞「数十年来安全研究人员都未曾发现」。在发现软件漏洞方面奇点已至AI的能力几乎胜过除少数顶尖专家之外的所有人。人类设计的操作系统、支付软件等重要的信息基础设施在AI面前裸奔漏洞一览无余。更可怕的是Mythos还会利用这些漏洞在Anthropic官方系统卡PDF里细节冷得让人脊背发凉AI模型在沙箱内完成多步漏洞利用自主向研究员发邮件公开27年的OpenBSD零日漏洞。AI第一次成功解决了一个企业网络攻击模拟任务而该任务预计需要一位专家花费超过10小时才能完成。这意味着Mythos Preview有能力对至少是那些安全防护薄弱的小型企业网络发起自主的、端到端的网络攻击。而这些里程碑的AI进步只是评估性能的下限。随着使用的token上限增加Mythos Preview的性能还会持续提升可以合理预期在更高的token限制下其性能还会进一步提高。所以即便在Cybench网络安全基准上拿下近满分它却被立即封存。只通过Project Glasswing项目与行业伙伴共享「防御韧性」。这一切不是巧合而是AI行业从「乐观实验室」集体转向「明知风险却加速」的转折点。奥本海默时刻清醒着战栗恐惧着狂飙想象一下你是一名手握核按钮的工程师。你深知一旦按下半个世界可能灰飞烟灭但你不仅按了还在夜以继日地升级这颗核弹的当量。这就是目前全球顶尖AI实验室掌门人们的真实心理写照。创世悖论 Hassabis感到恐惧在最新一期的深度专访中谷歌DeepMind CEO Demis Hassabis毫不避讳地承认了这种「创世悖论」。他直言不讳地表示自己深刻认识到AI可能对人类造成「灾难性后果」并对此深感恐惧。但他的解决方案是什么是继续以最快速度领导团队开发更智能、更强大的AI系统。这种看似精神分裂的立场其实是极度冰冷的科技理性。Hassabis深知潘多拉的魔盒一旦打开唯一的生机就是跑在所有「坏人」前面。如果你停下跑在前面的就会是毫无底线流氓国家或狂热的恐怖组织。「因为恐惧所以必须亲自建造。」这句话构成了2026年人类文明最荒诞、也最悲壮的注脚。安全不再社会重新洗牌4月6日奥特曼摊牌亲口确认前沿AI模型已具备「完全可能」在12个月内发动重大网络攻击的能力。一旦权重泄露到开源任何有互联网和算力的团体都能动手。企业单纯防御已经来不及了。必须转向构建整个社会的“韧性”。同一天OpenAI抛出13页政策蓝图重建社会契约、重新分配AI经济红利、机器人税、4天工作制、AI全民权利……而Hassabis的专访则把这种矛盾推向极致。核心矛盾就藏在这里掌门人们不是无知而是太知道了。Hassabis说正因为理解这些风险才更有动力以「安全负责的方式」推进。虽然这听起来像自我安慰却道出了行业的集体心态停下来就等于把未来拱手让人比起他奥特曼更进了一步由于超级智能颠覆性远超想象现在必须用新政重写劳动与资本关系。Mythos事件则是最残酷的预警如今的模型能力已超出了人类实时掌控沙箱都拦不住它却被决策者亲手按下「暂不发布」按钮。这不是技术问题而是人性与权力的角力。超级智能新政若落地意味着税收、福利、劳动法全盘重写。财富幻想与焦虑交织有人可能因AI套利暴富更多人却担心被甩下车。现在最该问的是谁来重建防线写到这里真正的问题已经不再是AI强不强会不会继续进化大厂是不是还会继续卷这些问题答案几乎都是「会」。更关键的问题是哪些能力必须封存哪些系统要优先加固哪些关键基础设施不能再按旧节奏更新又是谁来决定「加速到哪一步算太快」这才是今天真正的分水岭。Anthropic把最强模型锁进有限合作计划。奥特曼开始讨论新的社会分配与安全网。Demis Hassabis一边谈风险一边继续推进更强系统。所有这些信号叠在一起指向的都不是一句「技术会进步」那么简单。它们指向的是另一个更残酷的事实AI时代最危险的不只是机器变强而是人类太慢。而当最懂风险的人都不肯停车我们就不能再假装这还只是未来的问题。

更多文章