机器学习(ML)推理通常需要处理极其敏感的数据,例如医疗记录、专属商业机密或个人通讯内容。如果你能在云端运行机器学习推理,同时又对云平台本身隐匿数据,那会怎样?更具体地说,如何确保你的数据在整个机器学习推理生命周期中始终保持加密状态?本文将向你展示如何结合使用 Amazon #SageMaker AI 与全同态加密(#FHE)技术来进行机器学习推理。通过使用 FHE,我们提供了一种创新的推理方案,旨在使查询、响应以及所有中间计算值对任何观察者(包括 SageMaker AI 平台本身)都保持加密且不可读的状态。
全同态加密(FHE)是一种允许在不解密的情况下直接对密文进行计算的加密技术。在机器学习推理场景中,你可以直接对加密的查询数据运行模型,并在不解密的前提下生成同样呈加密状态的预测结果。这种能力在以下典型场景中具有巨大的商业和合规价值:
- 医疗健康:医疗保险公司希望为医生提供机器学习模型以预测手术预后,虽然云端部署方便,但隐私法规限制了医生向第三方透露患者健康隐私。
- 能源行业:油气公司利用 ML 评估潜在钻井地点的卫星照片,他们希望通过云端托管降低成本,但无法向第三方公开敏感的地理位置照片。
- 电信领域:运营商需要对客户邮件进行垃圾邮件和钓鱼检测,虽然亟需云端扩展性,但数据保护条例要求客户信息在第三方云平台中必须保持加密。
尽管此前的方法是通过使用诸如 SEAL 等底层库、手动编写算法来“从零开始”实现基于 FHE 的推理,但本文介绍了一种更加灵活且更高抽象度的实现方案。我们采用了专为 FHE 推理设计的上层框架 concrete-ml。该库“开箱即用”地支持多种常见的模型类型,并且在 API 层面与广受欢迎的机器学习库 scikit-learn 保持高度兼容。
在这篇指南中,你将学会如何利用自定义容器在 SageMaker AI 中训练 concrete-ml 模型,并将该模型部署到 SageMaker AI 的推理终端节点。此外,我们还将构建一个自定义客户端以处理本地的同态加解密,并最终通过该客户端向云端端点发起安全的端到端密文查询。
全同态加密(FHE)与 Amazon SageMaker AI 的结合,为解决 AI Agent 生态中最核心的“数据信任壁垒”提供了全新的范式。在未来的多 Agent 协同场景中,不同组织或个人部署的 Agent 必须频繁交换敏感上下文与私域知识。传统的联邦学习或差分隐私虽能保护模型训练,但在运行时推理阶段依然存在数据泄露风险。而通过 concrete-ml 等高层 FHE 框架,Agent 可以在完全不暴露原始 Prompt 和私域知识的前提下,向第三方大模型或工具 Agent 请求联合推理与计算。这打破了跨企业、跨主体的 Agent 协作屏障,使得“零信任 AI 协作(Zero-Trust AI Collaboration)”成为可能。横向对比多方安全计算(MPC)和可信执行环境(TEE/SGX),FHE 虽然在算力开销上仍面临一定挑战,但其摆脱了对特定硬件的依赖,为 AI Agent 在医疗、金融等强监管领域的深远落地铺平了道路。