一边是亚马逊re:Invent展会上的万人迷醉,Agent被奉为确定性未来;另一边,是开发者私下对成本与基建薄弱的灵魂拷问。

2025年12月的美国科技圈,被一场“冰与火之歌”分割。在拉斯维加斯,亚马逊云科技年度盛会re:Invent将AI智能体(Agent)捧上神坛,全场展商言必称Agent,气氛炽热如“春晚”。而在同期的圣地亚哥,顶尖的AI研究者们在NeurIPS大会上,探讨着更遥远的未来。

然而,当喧嚣散去,开发者们冷静的共识开始浮现:Agent的时代确实已经到来,但承载它的基础设施,却远未做好准备。这场表面上的盛宴,实则是一场在成本、数据与生态三重压力下的“暗战”。


01 Agent狂欢:从概念到“确定性未来”的加冕

黎明前的暗战:硅谷AI盛宴的A面与B面(图1)

如果2024年AI的关键词是“大模型”,那么2025年的聚光灯毫无争议地转向了“智能体(Agent)”。在亚马逊re:Invent大会上,CEO Matt Garman宣布的12项新发布全部围绕Agent展开,并断言:“AI Agent的出现,正在让AI的价值真正释放。”

会场的热度直观反映了这一趋势。一位亚马逊工程师描述道,如果与每个宣称做Agent的展商干杯,“走一半你就醉了”。与去年只有零星几家厂商提及Agent相比,今年它已成为绝对的主流叙事。

这种狂热源于一个根本性的认知转变:大模型本身是强大的“大脑”,而Agent才是能让这个大脑去理解、规划并执行具体任务的“手和脚”。它让AI从被动应答的聊天机器人,进化为能主动处理工作流的智能助手。

无论是数据库巨头Snowflake、MongoDB,还是新兴的AI应用公司,都在全力将自己嵌入Agent的生态链条。Agent被视为将AI潜力转化为实际生产力和商业价值的“确定性未来”。

02 成本冷水:推理费用成初创公司的生死线

与展会上的迷醉形成鲜明对比的,是硅谷开发者和创业者们异常清醒的共识。数据库服务商PingCAP联合创始人黄东旭直言:“我要来‘泼冷水’。不管从成本,还是从AI-first的能力上来说,我觉得目前Agent的基础设施还很薄弱。”

高昂的推理成本是浇下的第一盆冰水。由于复杂任务需要调用能力更强的“Pro”级别模型,AI Agent的成本中平均80%-90%都花在了模型推理上。一家AI应用公司的创始人公开表示,只有将推理成本降低80%,公司才可能有真正的利润。

成本压力如此之大,以至于在美国创投圈,“为降低成本做开发”已成为一种新的竞争力评价体系。风险投资者们现在普遍会问Agent初创公司一个致命问题:“推理成本多少?你的订阅收入能覆盖推理成本吗?” 这直接关乎公司的生死存亡。

黎明前的暗战:硅谷AI盛宴的A面与B面(图2)

03 生态错配:为“人”设计的软件,难住了AI

比成本更根本的挑战,在于整个软件生态的“错配”。Anthropic的一名产品经理指出:“目前的软件生态,是为人开发的,而不是为AI Agent开发的。”

黄东旭从技术角度解释了这种错配:首先,AI讨厌数据孤岛,这迫使它消耗大量Token在不同系统间“沟通”;其次,面对海量API接口,AI容易因“注意力分散”而产生幻觉或智力下降。

例如,一个简单的数据查询任务,为人设计的界面可能需要多次点击和筛选,而AI则需要将这些步骤转化为复杂的、易出错的提示词。这呼唤一场面向AI的“软件革命”:设计能让Agent用最简语言(如类似SQL的指令)交互的界面,并彻底打破数据壁垒。

04 暗战升级:基础设施层的隐秘淘金热

黎明前的暗战:硅谷AI盛宴的A面与B面(图3)

挑战的另一面,是巨大的机遇。Agent的痛点,正催生新一轮以“优化AI基础设施”为核心的创业与投资热潮。

首先是算力与存储的优化。行业瓶颈正从“GPU短缺”演变为“内存短缺”。通过优化底层设施来降低推理成本,成为最热门的创业方向。英伟达在2025年9月被曝豪掷超9亿美元,收购了一家AI基础设施初创公司的技术授权。

其次是数据的价值重估。决定Agent智能上限的,不再是单一的模型大小,而是其能够调用和处理的数据质量与实时性。因此,能够为Agent提供高质量、低延迟、易访问数据平台的厂商,迎来了新的春天。这正是像IBM这样不惜以110亿美元收购实时数据流平台Confluent的核心逻辑。

最后是模型本身的进化竞赛。在应用层Agent蓬勃发展的同时,模型层的竞争已进入白热化。OpenAI为应对谷歌Gemini的强势崛起,正全力开发代号“Garlic”的新模型,试图以更低成本实现更强性能。而谷歌则凭借其安卓生态的深度整合,让Gemini获得了无可比拟的用户增长优势。


在re:Invent展会现场,一位Anthropic员工的总结点破了这场“暗战”的本质:“Agent目前不是泡沫。但一旦人人追逐最显性的应用,没人做好与之匹配的基建,这就会成为泡沫。”

这场硅谷的“冰与火之歌”揭示的,正是AI技术浪潮演进中的一个关键阶段:应用想象的狂奔与基础设施滞后的现实之间的激烈博弈。Agent的舞台已经搭好,聚光灯已然就位,但主角们却发现,脚下的地板尚不稳固,而演出必须继续。这场黎明前的暗战,将决定哪些玩家能真正迎接AI智能体时代的曙光。