
发布日期:2025-07-06 12:49 点击次数:121
继 TD Cowen 后成年笑话,巴克莱似乎也开动唱空 AI 算力。
猫色成人网3 月 26 日,巴克莱发布最新接头称,2025 年公共 AI 算力可支捏 15-220 亿个 AI Agent,似乎足以欢娱好意思国和欧盟的绝大部分需求。而同日TD Cowen 分析师称撑捏东谈主工智能运算的蓄意机集群供过于求。
巴克莱研报指出,AI 行业需要从"意外旨基准测试"转向真确灵验的 Agent 家具部署。同期巴克莱分析师默示:
AI Agent 阛阓的增长后劲高大: 行业算力大约支捏大限制 Agent 部署,预示着高大的阛阓契机。
推理老本是关节: 低推理老本对于 Agent 家具的盈利至关迫切,这将驱动对更高效的 AI 模子和算力的需求。
开源模子的迫切性: 开源模子将在镌汰老本方面发达关节作用,投资者应关爱关联范围的动态。
算力供需:充足还是不及?
对于 AI 算力的供需均衡,巴克莱展示了几个中枢发现:
行业推理容量基础:2025 年公共约有 1,570 万个 AI 加快器(GPU/TPU/ASIC 等)在线,其中 40%(约 630 万个)将用于推理,而这些推理算力中约一半(310 万个)将挑升用于 Agent/ 聊天机器东谈主奇迹;
算力分拨正在演变:企业客户已开动转向老本更低的开源模子,如 Salesforce 的 Agentforce 弃取 Mistral 开源模子(7B-141B 参数),而非最上流的稀疏前沿模子;
开源模子下载激增:Hugging Face 数据显现 DeepSeek、Llama 和 Mistral 等开源模子的下载量正在飞速增长,这一趋势将跟着从聊天机器东谈主向 Agent 的转机而加快。
算力供应诚然名义上充足,但面对结构性挑战。巴克莱明确默示:
若是 Agent 家具真确升空并抵消费者和企业用户终点灵验,咱们可能需要
1)更低廉、更小但性能雷同高的基础模子(DeepSeek 立场);
2)更多推理芯片装配;以及
3)可能需要将已装配的检修 GPU 再行用于推理。
这标明,诚然现在总体算力看似充足,但针对高效、低老本 Agent 家具的专用算力仍有较大缺口。巴克莱指出这意味着,在 AI Agent 赛谈上,具有高效推理老本结构和专注莳植微型高效模子的公司可能领有更大竞争上风,而仅依赖大模子而不接头单元经济学的公司可能面对更大挑战。
推理老本:AI Agent 的经济学挑战
巴克莱指出AI Agent 的推理老本正成为行业发展的中枢考量身分:
AI Agent 生成的 Token 数目高大:比拟传统聊天机器东谈主,Agent 家具每次查询生成约 10,000 个 Token,是聊天机器东谈主 ( 约 400 个 ) 的 25 倍,这极大加多了推理老本;
不同模子的经济效益相反高大:以年度订阅老本蓄意,基于 OpenAI o1 模子的 Agent 家具老本高达 2,400/ 年,而基于 DeepSeekR1 模子仅需 88/ 年,后者提供了 15 倍于前者的用户容量;
超级 Agent 需求正在兴起:OpenAI 规画推出的 " 超级 Agent" 家具,这类高端家具将铺张更多 Token,每月高达 3,560 万个,逐日查询次数可达 44 次,远超级闲 Agent 的 2.6 次。
从单元经济学角度看,以 Token 计价的形状将决定不同模子的阛阓竞争力。正如巴克莱接头指出:
这阐述了低推理老本的迫切性。由于其自主性质,Agent AI 家具的 Token 铺张趋势远高于聊天机器东谈主。
此外成年笑话,巴克莱分析师默示,诚然"超级 Agent "有后劲,但其致力于的推理老本可能限度其大限制欺诈。投资者在评估此类家具时,应严慎接头其经济可行性。