云服务领域最新动态：Cloudflare Blog公开文章解读 | 技术洞察

在过去的几个月里，我们一直在自己的基础设施上测试一系列以安全为重点的LLM。这些LLM有助于识别我们自己系统中的潜在漏洞，因此我们可以修复它们–它们还向我们展示了攻击者将能够使用最新模型做什么。这些LLM中没有一个比来自Anthropic的Mythos Preview吸引了更多的关注。

几周前，我们受邀使用Mythos Preview作为Glasswing项目的一部分。我们很快就把它指向了我们自己的五十多个存储库–看看它会发现什么，看看它是如何工作的。这篇文章分享了我们观察到的情况、模型表现良好的地方和不足的地方，以及围绕这些模型的架构和流程需要如何改变，以便大规模使用。

Mythos Preview是向前迈出的真正一步，在进入其他任何事情之前，都值得一提。我们已经根据我们的代码运行模型一段时间了，从以前的通用前沿模型到今天的Mythos Preview所做的跳跃不仅仅是对以前的改进。

这是一种不同的工具，做不同的工作，这使得与早期模型进行干净的苹果对苹果比较变得困难。因此，与其尝试将Mythos Preview与通用前沿模型进行基准比较，不如描述它实际上可以做些什么，以及在我们使用Mythos Preview所做的工作中突出的两个功能：利用链构建-真正的攻击很少使用一个错误。

它将几个小的攻击原语链接在一起，形成一个工作漏洞。例如，它可能会将自由使用后的错误转化为任意的读写原语，劫持控制流，并使用面向返回的编程（ ROP ）链来完全控制系统。Mythos Preview可以采用其中的几个原语，并说明如何将它们组合成一个有效的证明。