据知情人士透露,谷歌内部的AI研究人员正面临一场前所未有的“算力危机”。尽管谷歌拥有全球最庞大的数据中心和自主研发的TPU(张量处理器)网络,但随着多模态大模型和自主AI Agent(智能体)研究的爆发式增长,内部科研人员不得不通过各种游说和内部竞争来争夺宝贵的计算资源。
在谷歌合并了Google Brain和DeepMind并成立Google DeepMind之后,资源的统一分配成为了一个巨大的挑战。知情人士表示,研究人员现在需要向一个专门的资源审查委员会提交详细的提案,以证明他们的项目值得分配数十万个TPU时。这种机制虽然提高了算力利用率,但也导致了创新步伐的延缓,部分探索性极强的AI Agent实验因无法提供即时的商业化回报而被迫让位于更主流的Gemini迭代项目。
随着AI技术向“具身智能”和“复杂推理Agent”方向演进,模型在训练和运行推理(Inference-time compute)时所需的算力呈指数级增长。这使得谷歌内部原本就紧张的算力预算更加捉襟见肘,甚至引发了顶尖人才流向拥有更灵活算力初创公司的担忧。
【AgentUpdate 深度解析】 算力不再仅仅是基础设施,而已成为决定AI Agent演进速度的核心制约因素。从单纯的“快思考”Prompt响应到具备主动规划、自我纠错的“慢思考”自主Agent,其背后依赖于强化学习(RL)和极其庞大的试错计算。谷歌内部的算力之争,折射出整个AI行业共同面临的窘境:即使拥有自主芯片,在多Agent协同与连续推理的庞大需求面前依然供不应求。横向对比来看,未来Agent生态的胜负手,可能不仅在于谁拥有最大规模的集群,更在于谁能通过如MCP(模型上下文协议)或端侧轻量化架构,实现算力的极致去中心化与高效调度。