⌘K
Change language Switch ThemeSign In
Narrow Mode
Too dangerous to release?!
!Image 2: The PrimeTime The PrimeTime @The PrimeTime
One Sentence Summary
The Primagen critiques Anthropic's 'Claude Mythos' model, questioning its 'too dangerous to release' marketing narrative while reflecting on the evolving value of traditional software engineering skills in the AI era.
Summary
This video features developer influencer The Primagen analyzing Anthropic's latest AI model, 'Claude Mythos'. Anthropic claims the model possesses unprecedented capabilities in discovering zero-day vulnerabilities—including 27-year-old bugs—and has consequently restricted public access due to safety concerns. The Primagen dissects this 'fear-based' marketing strategy, comparing it to previous AI hype cycles. Beyond the technical claims, he reflects on the existential anxiety felt by veteran developers regarding the obsolescence of traditional skills like Vim mastery. Ultimately, he advocates for maintaining a grounded perspective, suggesting that deep foundational knowledge remains essential for verifying AI output, even as the nature of software development shifts.
Main Points
* 1. Skepticism toward 'too dangerous to release' marketing narratives.The author highlights a recurring pattern in AI industry PR where companies leverage fear to advocate for regulation and build hype, questioning whether the 'Mythos' model's danger is as extreme as claimed. * 2. AI's evolving role in security research.While acknowledging that AI has moved past generating 'noisy' false positives to actually identifying complex, long-standing vulnerabilities, the author remains cautious about the lack of public verification for these claims. * 3. The shift in value for traditional engineering skills.The author argues that while manual skills like Vim mastery may seem less critical, the deep foundational understanding gained through years of practice is what allows senior engineers to effectively audit and correct AI-generated code.
Metadata
AI Score
85
Website youtube.com
Published At Today
Length 3015 words (about 13 min)
Sign in to bookmark videos and track your viewing history. Sign in now
!Image 3: Too dangerous to release?!
Too dangerous to release?!
内容概要
在这段视频中,知名开发者博主 The Primagen 深入分析并吐槽了 Anthropic 最新披露的 AI 模型「Claude Mythos」。Anthropic 声称该模型在多项基准测试中远超之前的 Opus,尤其在安全研究领域展现出了惊人的能力,能够自主发现并利用存在数十年的操作系统零日漏洞。正因为其潜在的破坏力巨大,Anthropic 决定暂时不对公众开放该模型。The Primagen 对这种「因太危险而无法发布」的宣传口径表达了独特的见解与怀疑,同时探讨了在 AI 飞速发展的今天,程序员传统的底层技能(如熟练使用 Vim 等)是否正在失去价值,以及开发者应当如何调整心态面对这一变革。
目录
* 神秘的 Claude Mythos:性能实现跨越式升级
* 惊人的安全漏洞挖掘:27 年前的老 Bug 也难逃法眼
* 闭门不出:为什么普通用户无法接触 Mythos?
* 质疑与槽点:又是熟悉的恐惧营销套路?
* 技能焦虑:程序员的传统手艺正在过时吗?
* 保持清醒:在 AI 浪潮中重塑个人价值
神秘的 Claude Mythos:性能实现跨越式升级
这里我们再次见证了 Claude 的壮举。它又发布了一个新版本,而且这次的版本命名非常特别。我们不再谈论旧的 Sonnet、Opus 或 Haiku,我们已经升级到了 Mythos。这被描述为有史以来发布的最伟大的模型,它不仅伟大,而且表现极其出色。但有一个前提,那就是屏幕前的你,没错,就是你,目前还不能使用它,甚至连碰都不能碰。
显然,这个模型在寻找漏洞和破解沙箱方面的能力堪称一绝,简直无人能敌。我们讨论的是它仅仅通过连接就能让电脑瘫痪的能力,它简直就是模型界的查克·诺里斯。据称它能够摧毁一切,你得藏好你的孩子,藏好你的树莓派,因为它正准备横扫所有系统。
让我们来看看这个新模型的一些统计数据。Anthropic 发布了一系列性能指标,同时也发布了那些让人感到不安的部分,而这正是 Anthropic 的典型做法。他们推出一个强大的新模型,然后紧接着就会说:「顺便说一句,AI 超级恐怖,简直是史上最吓人的东西。所以政府部门得赶紧介入,加强监管,帮我们控制它,因为这玩意儿实在太吓人了。」
首先来看那些最不重要的指标,虽然这些数字对我来说并没有太大意义。在 Sweet Benchmark Pro 测试中,Mythos 预览版的得分是 77.8%,而之前的 Opus 只有 53.4%。你可以看到性能提升是非常巨大的,实际上提升了将近 20% 以上。这对你我意味着什么呢?其实什么也意味着不了,因为你根本碰不到这个模型。只有亚马逊、谷歌、苹果等少数顶尖公司的核心人员,以及美国政府被允许接触它。在推理能力方面,GP QA Diamond 测试中 Mythos 预览版也完全压制了之前的版本,在某些模拟考试中,即便是没有工具辅助的 Mythos 也在接近及格边缘,而一旦配上工具,它甚至能拿到一些大学的学位。这种 PhD 级别的智能表现确实令人瞩目。
惊人的安全漏洞挖掘:27 年前的老 Bug 也难逃法眼
这个模型真正有趣的部分在于安全研究。我之前发布过一段视频,提到 CURL 的首席维护者 Daniel Stenberg 曾表示 AI 的报告质量已经显著提高,开始能发现真正的安全问题。在很长一段时间里,安全领域的 AI 本身就是个安全问题,因为它会产生海量的虚假报告,让维护者根本无法处理。但从 46 版本开始,情况发生了重大转变,我们开始看到 AI 能够认真地发现一些东西了。
而这个全新的 Mythos 预览版显然更胜一筹。根据测试,Mythos 在用户指令下,有能力识别并探索所有主流操作系统和主流网络浏览器中的零日漏洞。它发现的漏洞通常非常细微,极难检测。其中许多漏洞已经存在了 10 年或 20 年,目前发现最久远的是一个存在了 27 年、现已被修补的 OpenBSD 漏洞,而 OpenBSD 可是以安全性著称的操作系统。
Mythos 预览版还编写了一个浏览器漏洞利用程序,通过链式调用四个漏洞,编写了一个复杂的 JIT 堆喷射程序,成功逃逸了渲染器和操作系统的沙箱。它还能在 Linux 等系统上通过利用微妙的竞争条件和内核地址空间布局随机化(KASLR)绕过,自主获得本地提权。它甚至在 FreeBSD NFS 服务器上自主编写了远程执行代码漏洞,通过将一个 20 步的 ROP 链分散到多个数据包中,为未经身份验证的用户授予了完整的 root 权限。它甚至还在 FFmpeg 这个手工打造的库中发现了一个存在 16 年之久的漏洞。
闭门不出:为什么普通用户无法接触 Mythos?
如果这些都值得信赖,如果这一切真的正在发生,那么我们正在进入 AI 史上最令人印象深刻的时代。到了这种程度,公开发布这个模型可能会导致历史上存在的每个系统都面临被黑客攻击的风险。
这就是为什么 Anthropic 会说:「我们不打算向公众开放 Claude Mythos 预览版。我们计划在即将推出的 Claude Opus 模型中推出新的防御措施,利用一个不具备 Mythos 那种风险水平的模型来改进和完善这些措施。」所以,那 20% 以上的性能提升,你暂时是体验不到了。你可能会得到一个更聪明的 Claude,但不一定是那个最强的版本。
这是否意味着我们正步入一个由存储在大型仓库里的 GPU 所支撑的「天才国度」?在这个国度里,Anthropic 拥有绝对的话语权,而你只需要简单的文本描述就能创造出任何你想要的东西?听起来并不完全是这样。虽然少数人可能拥有这种力量,但我认为你我近期内都不太可能接触到。他们会先把它释放给几位科技界的巨头,谁知道它什么时候才会真正下放到大众手中。
质疑与槽点:又是熟悉的恐惧营销套路?
所以,这真的像看起来那么严重吗?虽然我们确实看到了来自 FFmpeg 等机构的感谢回执,但也有人不买账。比如有人在推特上说:「这非常强大,应该让人感到恐惧。」他们继续推销这种叙事,但别忘了,当年 GPT-2 发布时也是同样的套路——「这太危险了,必须超级小心,实在太危险了不能发布」。
正如某些评论指出的,他们给这个模型起名叫 Mythos(神话),大概是因为没人能真正见到它。这感觉就像是在故意挑逗观众,也就是所谓的「钓鱼」。
很难不看着这一切并意识到,我的某些技能正一年比一年变得无关紧要。比如熟练操作各种 Vim 快捷键的能力,这感觉像是一种正在消亡的技能,这真的让人挺难过的。现在的年轻一代可能不会再去学习这些精细且困难的任务了,因为他们更倾向于直接依赖模型。
技能焦虑:程序员的传统手艺正在过时吗?
在过去的 20 年里,我一直在打磨这些技能。当其他人在外面玩乐的时候,我一直在磨练自己的手艺。而现在,这些技能似乎每年都变得更没用一点。
但我对此其实感到释然。这听起来可能很奇怪,但我真的觉得没关系。如果这些工具真的能变得如此出色,我不需要再把自己定义为「史上最伟大的 Neovim 用户」。我可以继续使用 Neovim 并享受它,但它不必成为我的核心身份。同时我也很高兴经历了这么多年的磨炼,去理解如何编写优秀的软件。因为现在即使我使用 AI 生成代码,我一眼就能看出哪里出错了。这种深层次的理解,是那些从未亲手接触过软件开发的人所无法企及的。即便有一天这些技能也彻底失效,我也必须接受现实。
保持清醒:在 AI 浪潮中重塑个人价值
我想聊聊这些,是因为现在是一个非常有趣的时期。我很感激能有机会和大家交流,因为我知道很多人对现状感到不确定和担忧。尤其是面对那些炒作大户的疯狂言论,比如「宇宙末日要来了」。甚至是 Anthropic 的这份报告,宣称它能利用每个浏览器、每个操作系统,能发现 27 年前的 Bug。这种持续的恐惧灌输,是对大家精神的一种攻击。
[语气转为轻松]
我很高兴 Anthropic 能向大公司迈出步伐去修复这些问题,但同时我也不想生活在那种极度的压力和负面情绪的轰炸之下。换个角度看,我现在拥有了以前需要更长时间、更困难才能实现的能力。以前我精力有限,只能做几个副业项目,现在借助 AI,我可以以更快的速度开启甚至放弃更多的项目。这种感觉其实挺奇妙的。
无论如何,生活还得继续。如果你想体验真正的硬核,那就去用 SSH 终端点咖啡吧。如果你连 SSH 是什么都不知道,那这种高阶体验可能并不适合你。我们依然在过着梦想中的生活。
!Image 4: The PrimeTime The PrimeTime @The PrimeTime
One Sentence Summary
The Primagen critiques Anthropic's 'Claude Mythos' model, questioning its 'too dangerous to release' marketing narrative while reflecting on the evolving value of traditional software engineering skills in the AI era.
Summary
This video features developer influencer The Primagen analyzing Anthropic's latest AI model, 'Claude Mythos'. Anthropic claims the model possesses unprecedented capabilities in discovering zero-day vulnerabilities—including 27-year-old bugs—and has consequently restricted public access due to safety concerns. The Primagen dissects this 'fear-based' marketing strategy, comparing it to previous AI hype cycles. Beyond the technical claims, he reflects on the existential anxiety felt by veteran developers regarding the obsolescence of traditional skills like Vim mastery. Ultimately, he advocates for maintaining a grounded perspective, suggesting that deep foundational knowledge remains essential for verifying AI output, even as the nature of software development shifts.
Main Points
* 1. Skepticism toward 'too dangerous to release' marketing narratives.
The author highlights a recurring pattern in AI industry PR where companies leverage fear to advocate for regulation and build hype, questioning whether the 'Mythos' model's danger is as extreme as claimed.
* 2. AI's evolving role in security research.
While acknowledging that AI has moved past generating 'noisy' false positives to actually identifying complex, long-standing vulnerabilities, the author remains cautious about the lack of public verification for these claims.
* 3. The shift in value for traditional engineering skills.
The author argues that while manual skills like Vim mastery may seem less critical, the deep foundational understanding gained through years of practice is what allows senior engineers to effectively audit and correct AI-generated code.
Key Quotes
* They launch a powerful new model, and then immediately say: 'By the way, AI is super scary, it's the scariest thing ever. So the government needs to step in.' * This feels like they are intentionally teasing the audience, what is known as 'baiting'. * I'm glad I spent all those years honing my craft, because now, even when I use AI to generate code, I can see exactly where it's wrong.
AI Score
85
Website youtube.com
Published At Today
Length 3015 words (about 13 min)
Tags
Claude Mythos
Anthropic
AI Safety
Zero-day Vulnerabilities
Software Engineering
Related Articles
* Anthropic Introduces Claude Opus 4.6 with 1M Token Context * What's really going on with AI, Expert weighs in | TheStandup * Anthropic Introduces Project Glasswing and Claude Mythos Preview * The Weird Side of Indie Game Development | The Standup * PewDiePie beat chatGPT? * Maintaining a Codebase with AI: Cloudflare's V-Next Experiment * Claude Opus 4.6 Released: Now Available Across All Major Platforms * The Birth & Death of JavaScript | Prime Reacts * Anthropic Releases Claude Sonnet 4.6 with 1M Context Window * Martin Fowler & Kent Beck: Frameworks for reinventing software, again and again HomeArticlesPodcastsVideosTweets