SOURCE // NEWS

突破表格预测瓶颈!大语言表格模型 NEXUS 登陆亚马逊 SageMaker

突破表格预测瓶颈!大语言表格模型 NEXUS 登陆亚马逊 SageMaker

亚马逊云科技宣布在 Amazon SageMaker AI 上正式支持 Fundamental 公司的 NEXUS 模型。通过此次发布,企业用户可以直接部署这款专为结构化表格数据预测而设计的基座模型(Foundation Model)。该模型能够助力企业在短短几天(而非数月)内,利用结构化数据生成精准且确定性的预测结果。本文将详细介绍如何在 Amazon SageMaker JumpStart 中快速上手 NEXUS,并解析其部署流程及如何对企业数据集运行预测。

什么是 NEXUS?NEXUS 是由 Fundamental 开发的专为表格数据预测构建的基座模型。当前的传统大语言模型(LLM)主要针对文本设计,而传统机器学习(ML)方法则需要繁重的特征工程和模型训练。NEXUS 采用了全然不同的路径:它在数十亿个真实世界的结构化数据集预测任务上进行了预训练,因此“天生”懂得如何从表格数据中提炼出关键信号。

作为一款大表格模型(Large Tabular Model),NEXUS 专为结构化数据分析而生,并带来了三大核心技术创新:首先是确定性架构,概率性 LLM 针对相同的查询可能会给出不同的答案,而 NEXUS 能够为每次独立预测提供一致且可复现的确定性结果;其次是原生表格理解,基于数十亿张表格的训练,NEXUS 无需手动特征工程即可原生处理数值、类别、日期以及非结构化文本;最后是非序列性推理,大多数 AI 模型预测的是序列化数据,而 NEXUS 专注于分析企业表格中的多维度关系。例如,在预测客户流失时,NEXUS 能够协同理解交易频率、支持工单和经济指标等多重因素对流失率的综合影响。

为什么现有方法难以满足需求?企业中最有价值的数据大多存在于电子表格、ERP、CRM 系统以及关系型数据库中。然而,现有的工具存在明显瓶颈:传统 ML 构建、训练和部署单场景模型需要数据科学团队耗费 3-6 个月,企业常面临预测质量与数量的艰难权衡;而 LLM 的非确定性使其在同一数据集上结果不一,且在 Token 符号化过程中容易丢失数值上下文,导致在结构化数据上表现不佳,需要极其复杂的护栏机制。

NEXUS 专为表格数据进行了架构优化,具备独特的优势,例如其具备“置换不变性”(Permutation invariance),能够识别出改变列的顺序并不会改变表格的实际含义。这与传统的 Transformer 架构有着本质不同,后者在处理结构化数据时常因顺序变化而产生推理偏差。

AgentUpdate 深度解析

长期以来,AI Agent 的演进高度依赖处理非结构化数据的 LLM,但在真实的商业场景中,超过 80% 的企业核心资产依然沉淀在结构化表格与数据库中。NEXUS 这一类“大表格模型”(Large Tabular Model)的出现,填补了 AI Agent 生态在“结构化数据决策”上的重大空白。它将传统的预测性 AI 与生成式 Agent 完美连接。未来的企业级 AI Agent 不仅能通过 LLM 进行自然语言交互,更能在后台无缝调用 NEXUS,以零样本或少样本的方式,对企业的 ERP、CRM 数据进行确定性的深度预测和复杂的多维因果推理。这种“双脑驱动”的模式——LLM 负责认知协同、LTM(大表格模型)负责高精度业务决策——将彻底重塑企业级 AI 工作流,为构建真正具备商业落地价值的自主 Agent 扫清技术障碍。