人工智能基础设施市场正在同步出现两个新信号:服务器租赁成本持续下行,算力Token支出增速趋于稳定。这两个信号共同指向AI领域一个核心命题——AI成本下降,究竟是催生更多需求,还是侵蚀现有定价能力?

日本AI实验室Sakana推出颠覆性"编排"框架模型Fugu,以协调多个前沿模型取代暴力扩参路线,在主流基准测试中超越Claude和GPT-5.5。

Sakana Fugu在SWE-Bench Pro测试中得分73.7,超越Claude Opus 4.8的69.2和GPT-5.5的58.6。Fugu并非单一大模型,而是一个动态调度器——通过单次API调用,决定将任务的不同部分路由至最适配的前沿模型并行处理,最终整合输出优于任何单一模型的结果。


高盛1-Delta台席负责人Rich Privorotsky将计算资源租赁价格视为追踪AI硬件投资逻辑是否成立的核心指标:市场的核心前提是算力稀缺;若供给上升导致租赁价格持续下行,将直接挑战稀缺性叙事。目前,服务器租赁成本已呈现明显下行走势。

然而Privorotsky同时指出,在Token支出格局发生根本性转变之前,硬件板块的交易逻辑料将延续。半导体ETF上周录得异常高的资金流入,印证了市场当前的定位偏好。

他表示,超大规模云计算商的价格动向将日益成为关键观察点,本周的市场焦点更多将落在美光财报数据上,而非PCE。

Fugu:编排驱动的前沿级性能

Sakana是一家总部位于东京的AI实验室,其联合创始人之一参与撰写了原始Transformer论文。

Sakana推出的Fugu框架颠覆了当下行业主流的"暴力扩参"逻辑。作为一个协调器,Fugu在接收单次API请求后,动态决策将任务的不同部分分配给不同前沿模型并行处理,最终输出一个优于任何单一模型独立作答的结果。

Rich Privorotsky将这一方法概括为通过"模型编排与融合"而非暴力扩参来实现前沿级性能。这一方法论若得到更广泛验证,将对算力军备竞赛的底层逻辑构成挑战——因为其性能增益并不依赖于更多的训练算力投入。

在出口管制风险日益上升的背景下,Fugu的模型池支持动态替换,赋予其额外的战略韧性:若某一提供商因管制受限,框架可自动绕开切换,降低供应链单点风险。这一特性使其在地缘博弈加剧的环境下具有独特的架构优势。

开源追赶加速,Token成本压缩深化

智谱发布的GLM-5.2在FrontierSWE长程编程基准上得分74.4,与Anthropic顶级模型Opus 4.8的75.1仅差约1个百分点,同时超越GPT-5.5的72.6,成为目前评分最高的开源权重模型,定价比Opus 4.8低约72%至82%。

Privorotsky指出,开源与闭源模型之间的差距正持续收窄。GLM-5.2采用MIT许可证,支持权重开放、模型蒸馏、量化与复现,代表能力的重大跃升,是该领域差距加速收窄的清晰信号。

随着能力更强的开源模型不断涌现,Token成本压缩进程正在加速。然而,Privorotsky强调,当前的激励机制仍指向更多资本支出而非更少。


服务器租赁价格:算力稀缺叙事的晴雨表

在Privorotsky的分析框架中,计算资源租赁价格是观察AI硬件投资逻辑是否成立的核心变量。

其逻辑链条清晰:若算力稀缺持续,价格应保持坚挺,从而为持续的资本支出提供正当性;反之,若供给上升导致租赁价格持续下行,将直接挑战稀缺性叙事,且"最先承压的是硬件"。

目前,服务器租赁成本已呈下行走势。Sakana Fugu此类编排框架的出现,或许正与这一趋势相互印证——通过更高效的资源调度而非单纯堆砌算力来提升性能,从技术层面折射出供给扩张的现实。

Privorotsky表示,市场注意力将越来越多地转向超大规模云计算商的价格动向,一旦后者释放战略调整信号,AI投资周期的底层逻辑将面临重新评估。