⚡ News

A3M Router v2.0发布:升级为支持39家厂商的OpenAI兼容AI网关

A3M Router v2.0发布:升级为支持39家厂商的OpenAI兼容AI网关

我们刚刚发布了 A3M Router v2.0.0。这是自该项目启动以来最重磅的一次更新。它已经从最初的一个简单的路由库,升级为了一个功能完备的 AI 网关(AI Gateway)

1. 兼容 OpenAI 的代理服务器

现在,你只需在终端运行以下命令即可在本地启动服务:

npx a3m-router serve

只需这一步,你就可以在本地的 localhost:8787 启动一个兼容 OpenAI 接口规范的 API 代理服务器。

由于它完全兼容 OpenAI API,任何现有的 SDK 无需修改核心代码即可直接无缝替换——只需修改 base_url。无论你是使用 Python、Node.js,还是 LangChain、LlamaIndex,都可以直接接入:

from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:8787/v1",
    api_key="not-needed"  # A3M Router 会自动在后台处理不同服务商的 API Key
)

response = client.chat.completions.create(
    model="auto",  # 启用智能路由
    messages=[{"role": "user", "content": "Hello"}]
)

2. 实时可视化仪表盘

你可以直接通过浏览器访问 http://localhost:8787/ 打开实时仪表盘,监控以下核心指标:

  • 请求量与费用支出
  • 服务商(Provider)的在线/离线状态(支持 39 家服务商)
  • 包含路由决策的详细请求日志
  • 按服务商维度拆分的成本细算

3. LangChain 适配器

新版本提供了针对 LangChain 的直接支持,可以作为 ChatOpenAI 的无缝替代方案,并且支持流式输出(Streaming)、工具调用(Tool Calling)以及结构化输出(Structured Output):

import { A3MChatModel } from 'adaptive-memory-multi-model-router/langchain';

const model = new A3MChatModel({ modelName: 'auto' });
const response = await model.invoke([new HumanMessage("Hello")]);

4. 安全护栏引擎(Guardrails Engine)

内置了安全检测机制,帮助开发者在网关层直接拦截不良请求:

import { GuardrailEngine } from 'adaptive-memory-multi-model-router';

const guardrail = new GuardrailEngine({
  promptInjection: true,
  piiDetection: true,
  contentFilter: true
});

const result = await guardrail.checkInput(userInput);
if (result.blocked) {
  // 检测到提示词注入或敏感个人信息(PII)
  console.log(result.reason);
}

该引擎支持检测提示词注入攻击、PII(邮箱、电话、身份证、信用卡、API Key 等)、有害内容,并能进行语种检测以辅助路由决策。

5. 语义缓存(Semantic Cache)

传统的精确匹配缓存命中率极低。A3M Router 2.0 引入了语义缓存,最棒的是它不需要调用任何外部 Embedding API,而是通过高效的 n-gram 相似度算法在本地计算:

import { SemanticCache } from 'adaptive-memory-multi-model-router';

const cache = new SemanticCache({ similarityThreshold: 0.92 });

// 第一次查询:未命中缓存,调用底层大模型服务商
const result1 = await cache.get("What is Python?");

// 语义相似的查询:命中缓存!直接返回结果,无需重复调用 API
const result2 = await cache.get("Tell me about Python");

6. 成本分析(Cost Analytics)

新版本还内置了 CostAnalytics 模块,帮助开发者实时统计和分析多模型调用中的 Token 消耗与资金支出,从而实现更精细化的 LLMOps 运营管理。

【AgentUpdate 深度解析】A3M Router v2.0 的发布标志着多模型路由层正在从简单的软件 SDK 向本地轻量级“网关”演进。相比于 LiteLLM 或 OneAPI,A3M 最具创新性的地方在于其“开箱即用”的本地运行能力,以及不依赖外部 Embedding API 的内置 N-gram 语义缓存和安全护栏。对于 AI Agent 生态而言,Agent 的多步骤链式调用(Chain-of-Thought)会产生极高的 API 延迟和调用成本,A3M 的本地语义缓存能显著降低高频重复任务的响应时间。此外,其内置的安全护栏直接在网关层拦截提示词注入,避免了 Agent 决策失控。这种“轻量、安全、低成本”的本地网关,正是构建高可靠、本地优先(Local-First)自主 Agent 架构不可或缺的底层基础设施。

↗ 阅读原文