您的人工智能账单失控。Cloudflare现在可以修复它。 | 技术洞察

目前，世界上没有一位首席信息官不担心人工智能的支出。首席财务官也越来越紧张。由于害怕落后，许多公司迫使员工尽可能积极地使用人工智能。法令很明确： “快走，我们稍后再弄清楚账单。“在大多数情况下，它奏效了：人工智能已经真正地为那些倾斜的团队带来了变革。

但成本是真实的：我们听到了无数关于巨额账单和代币支出痛苦超支的恐怖故事。今天，我们宣布Cloudflare AI网关中的支出控制，以及使用Cloudflare Access和现有身份提供商进行身份驱动预算和路由的封闭测试。

在我们与数百家公司谈论他们的人工智能战略时，我们看到了一个共同的故事：该公司通过共享的API密钥让每个工程师都可以访问前沿模型。用法起飞。在月底，财务部门提取发票，没有人可以解释钱去了哪里。是机器学习团队培训了新的渠道吗？是Claude Opus的电子邮件分流实习生吗？

这是否是一项失控的持续集成工作，在一个周末烧毁了5000万个代币？没有人知道，因为API密钥不会告诉您谁使用了它。如果没有指导方针，员工通常会接触到可用的最大型号。为什么不呢？如果没有预算，没有可见性，没有路由逻辑，合理的做法是使用最强大的模型来处理所有事情。问题是，大多数任务不需要前沿模型。

代码审查摘要不需要与复杂体系结构重构相同的模型。日志分析器不需要与面向客户的内容生成器相同的模型。为工作选择合适的工具应该很容易，而不是默认使用最强大、最昂贵的工具。查看支出用途应该很简单。