国防科技公司 Anduril 近日透露了其与 Meta 联合研发的军用增强现实(AR)头显原型的最新细节,勾勒出了一幅通过视线追踪和语音指令直接下达无人机打击指令的未来战场愿景。该项目由 Anduril 副总裁 Quay Barnett 主导,他曾服役于美国陆军特种作战司令部。Barnett 表示,他的根本目标是优化“作为武器系统的人类”,实现士兵与无人机的协同感知、信息无缝共享以及决策一体化。
目前 Anduril 正在并行推进两个相关项目。第一个是美国陆军的“士兵源任务指挥系统”(SBMC)。去年,Anduril 赢得了价值 1.59 亿美元的原型设计合同,与 Meta 合作在现有军用头盔上加装 AR 眼镜。与此同时,Anduril 还开启了一项自研的独立项目——EagleEye,这套集成了头盔与头显的系统虽未获得军方正式立项,但 Anduril 坚信其出色的性能最终会吸引军方买单。
虽然这两款系统距离正式服役仍需数年时间(陆军预计最早要到 2028 年才会将 SBMC 项目投产,此前微软曾获得 220 亿美元的类似合同,但因眼镜实用性问题最终被取消),但 Barnett 向《麻省理工科技评论》详细展示了 Anduril 原型的技术路径。系统会在士兵的视野中叠加各种战术信息,从简易指南针到复杂的区域地图、附近无人机飞行轨迹,乃至基于 AI 的目标(如卡车)自动识别。
在交互方面,士兵只需使用自然语言进行交谈,就能命令系统执行诸如呼叫伤员撤离或规划避开禁区的路线等任务。为了将士兵的口头指令精准转化为系统可执行的代码,Anduril 正在测试接入谷歌 Gemini、Meta Llama 甚至 Anthropic Claude 等主流大语言模型。整个系统的底层引擎是 Anduril 自研的 Lattice 软件,它能将各种军用硬件的数据聚合成统一的战场态势图。今年 3 月,美国陆军已宣布将拨款 200 亿美元,用于将 Lattice 系统深度整合至其几乎所有的基础设施中。
Barnett 的团队正在赋予这款头显执行多步骤复杂任务的能力。例如,士兵可以派遣无人机侦察某区域,并指示其在发现类似火炮装置的目标后返回;随后,系统会推荐应对方案(如派遣附近无人机进行打击),并提交给常规指挥链进行审批。如果一切顺利,未来士兵甚至无需开口,仅凭视线和手势即可完成这些多Agent协同的复杂战术操作。
【AgentUpdate 深度解析】Anduril 与 Meta 的这次合作,标志着 AI Agent 正式从软件、消费级硬件走向高烈度的军事国防前沿。这不仅是硬件层面的 AR 革命,更是一次基于多模态 Agent 架构的军事变革。Anduril 接入的 Lattice 系统扮演了分布式 Agent 协同枢纽的角色,将 Gemini、Llama 等异构大模型转化为“军事大脑”,使士兵能够通过语音、眼神等极其自然的用户界面(NUI)实时调度和操控复杂的物理 Agent(无人机、传感器)。这种端到端的“人在回路”(Human-in-the-loop)自主决策系统,代表了具身智能在极端环境下的终极形态,展现了具身 Agent 跨设备、跨空间协同的巨大潜力。然而,军事级 Agent 在强对抗、弱通信环境下,如何确保大模型的确定性与防幻觉能力,将是决定其能否最终走向战场的关键挑战。