云服务领域最新动态:Cloudflare Blog公开文章解读

这是一篇来自Cloudflare Blog的英文技术内容,

在过去的几个月里,我们一直在自己的基础设施上测试一系列以安全为重点的LLM。这些LLM有助于识别我们自己系统中的潜在漏洞,因此我们可以修复它们–它们还向我们展示了攻击者将能够使用最新模型做什么。这些LLM中没有一个比来自Anthropic的Mythos Preview吸引了更多的关注。

几周前,我们受邀使用Mythos Preview作为Glasswing项目的一部分。我们很快就把它指向了我们自己的五十多个存储库–看看它会发现什么,看看它是如何工作的。这篇文章分享了我们观察到的情况、模型表现良好的地方和不足的地方,以及围绕这些模型的架构和流程需要如何改变,以便大规模使用。

Mythos Preview是向前迈出的真正一步,在进入其他任何事情之前,都值得一提。我们已经根据我们的代码运行模型一段时间了,从以前的通用前沿模型到今天的Mythos Preview所做的跳跃不仅仅是对以前的改进。

这是一种不同的工具,做不同的工作,这使得与早期模型进行干净的苹果对苹果比较变得困难。因此,与其尝试将Mythos Preview与通用前沿模型进行基准比较,不如描述它实际上可以做些什么,以及在我们使用Mythos Preview所做的工作中突出的两个功能:利用链构建-真正的攻击很少使用一个错误。

它将几个小的攻击原语链接在一起,形成一个工作漏洞。例如,它可能会将自由使用后的错误转化为任意的读写原语,劫持控制流,并使用面向返回的编程( ROP )链来完全控制系统。Mythos Preview可以采用其中的几个原语,并说明如何将它们组合成一个有效的证明。