苹果高管 Craig Federighi 详细阐述了全新 Apple Intelligence 能力的高级架构。在介绍中,Federighi 明确表示,苹果的系统完全没有使用 Google Assistant。他首先勾勒了“传统的聊天机器人架构”,即运行在用户设备上的客户端应用访问第三方服务器上的云端模型,而这些模型会调用谷歌搜索等服务来获取世界知识,但苹果的路线截然不同。
苹果的系统对于简单的查询依然高度依赖端侧模型。在今年的操作系统更新中,大多数支持 Apple Intelligence 的设备将获得 AFM 3 Core——这是一款由谷歌与苹果联合开发、基于 Gemini 的新模型。而配备至少 12GB 内存及最新芯片的设备,则会使用 AFM 3 Core Advanced,该模型利用额外的硬件性能和设备存储空间来改善听写功能,并驱动更具表现力的 Siri 语音。
面对“更复杂”的问题,用户的设备将连接到同样由苹果和谷歌共同开发的云端模型:包括名为 AFM 3 Cloud 的通用模型、名为 ADM 3 Cloud 的图像生成模型,以及用于代理工具使用和复杂推理(agentic tool use and complex reasoning)的高级模型 AFM 3 Cloud Pro。苹果表示,前两款模型依然运行在苹果自家服务器的自研芯片中,而 Cloud Pro 模型则运行在由谷歌拥有的 Nvidia 硬件上。
为了在使用第三方硬件时依然能够兑现极致的隐私承诺,苹果推出了新一代的 Private Cloud Compute(#PCC),专门设计用于在外部硬件上运行。苹果综合运用了 Nvidia 的机密计算(Confidential Computing)、Intel 的可信域扩展(Trust Domain Extensions)以及谷歌的 Titan 安全芯片,提供了与苹果自有服务器同样严苛的多层保护。作为额外的安全措施,苹果还维护了一个“加密可验证、仅追加(append-only)的账本”,记录了所有 PCC 节点的谷歌云硬件,且苹果设备只信任这些服务器上由苹果官方签名的软件。
苹果此次披露的混合云端架构,不仅是隐私计算的一次技术突破,更对整个 AI Agent 生态的发展具有深远的启示意义。传统的端云协同架构往往需要在性能与隐私之间做出妥协,而苹果通过升级版的 Private Cloud Compute(PCC)在第三方硬件(如 Nvidia 和 Google)上构建了坚固的安全沙箱,彻底打破了“使用外部算力必定牺牲用户隐私”的魔咒。特别值得注意的是 AFM 3 Cloud Pro 专门针对“代理工具使用与复杂推理”的设计,这表明苹果正在为全自动化的 AI Agent 基础设施铺路。对比现有的开源框架(如 LangChain 或 CrewAI)在执行复杂多步敏感任务时常常遭遇的安全信任瓶颈,苹果结合硬件级机密计算为企业级 Agent 大规模部署提供了完美的信任闭环蓝图。可以预见,未来的智能体不但需要在本地完成高速低延迟感知,更需要像苹果这样通过“密码学验证账本”去调用庞大的云端推断能力,这将强势推动整个行业向“无摩擦且绝对安全”的分布式 Agent 网络加速演进。