Hayden Adams质疑Fable 5：AI安全边界正在误伤白帽生态_okex交易所官网-OKX官网-全球领先加密货币交易所登录入口

当前位置：首页币圈资讯详情

Hayden Adams质疑Fable 5：AI安全边界正在误伤白帽生态

OKX欧易官网
2026-06-10

大模型行业最近的争论，已经不再是谁的基准测试分数更高。

围绕Anthropic新推出的Claude Fable 5，越来越多开发者开始将焦点转向另一个问题：当模型变得越来越强大，安全机制究竟应该如何介入，又该介入到什么程度。

Uniswap创始人Hayden Adams近日公开批评Fable 5引入的安全分流机制。他认为，模型自动检测并拦截网络安全相关请求的做法存在根本性问题，因为用于系统加固、防御和审计的白帽需求，与攻击者的黑帽请求在技术层面往往高度相似，甚至使用相同的工具链和知识体系。

这句话恰好击中了当前AI安全治理最棘手的矛盾。

从模型厂商角度看，网络安全能力已经成为风险等级最高的领域之一。随着大模型逐渐具备漏洞发现、代码审计和自动化脚本编写能力，监管机构和安全团队对于潜在滥用的担忧持续升温。Anthropic此前发布的多份安全框架文件中，就曾将高级网络攻击能力列为重点监控对象。

问题在于，防御与攻击原本就是一体两面。

一家企业的安全工程师寻找系统漏洞，与黑客寻找漏洞，本质上使用的是相同技术路径；渗透测试团队进行红队演练时，执行的很多操作与真实攻击行为几乎没有区别。区别往往不在技术本身，而在目的和授权。

这使得AI模型很难通过单纯的语义判断区分两者。

如果安全策略过于宽松，模型可能被用于恶意用途；如果限制过于严格，受影响的却往往是最需要这些能力的合法用户。过去几年，GitHub Copilot、OpenAI以及Google等平台都曾遭遇类似争议。一些安全研究人员抱怨模型拒绝回答漏洞分析问题，而另一些人则认为现有防护仍然不足。

Fable 5争议的特殊之处在于，它采用了更主动的能力分流机制。

根据Anthropic此前披露的信息，当系统检测到高风险请求时，会自动切换至能力受限的模型处理。这意味着用户面对的可能不再是明确拒绝，而是一个表面正常响应、实际能力被降低的模型版本。

对于普通消费者而言，这种变化或许并不明显。

但对于开发者和安全研究人员来说，问题会变得复杂得多。当模型输出质量下降时，他们很难判断究竟是模型能力边界、推理错误，还是安全系统正在后台介入。开发流程中的可预测性因此受到影响。

Hayden Adams的担忧背后，其实反映的是开源技术社区长期坚持的一种理念：工具本身应保持中立，风险控制应该更多依赖使用场景和权限管理，而不是对知识本身进行筛选。

这种理念与当前主流AI公司的治理逻辑正在发生碰撞。

Anthropic、OpenAI等头部厂商面临的现实压力远超传统开源项目。随着企业客户、政府机构以及监管部门不断进入市场，模型供应商需要承担更多责任。一次重大安全事故的代价，可能远高于少数开发者的不满。

因此，今天的大模型行业出现了一种颇具戏剧性的局面。

一边是不断增强的模型能力，另一边则是不断收紧的安全阀门。模型越聪明，厂商越谨慎；能力越接近专业工程师，限制也越多。

Fable 5引发的争议未必会改变Anthropic的路线，但它暴露出一个越来越难回避的问题：未来AI行业竞争的不只是性能，还有透明度。

开发者可以接受安全规则的存在，却希望知道规则何时生效、为何生效，以及模型究竟在哪些地方被限制。

当大模型开始承担软件开发、安全审计甚至科研辅助工作时，能力本身已经不是唯一卖点。对于专业用户而言，一个可预测、可解释的模型，有时比一个更强但行为不透明的模型更有价值。

而这场关于白帽与黑帽边界的争论，或许才刚刚开始。

欧易数字货币交易所更快、更好、更强