探索与 agent-evaluation 相关的全量生态内容池。
PandaProbe 是由 Chirpz AI 开发的开源 Agent 工程化平台,专注于 AI Agent 的协作式追踪、评估、监控与调试。它通过 SDK 实时采集 Trace 数据,利用 LLM-as-a-judge 机制对 Agent 表现进行自动化评分,并提供可视化面板帮助团队分析复杂的工作流。该平台通过 FastAPI 和 Celery 架构支持高性能数据摄取,支持 Docker 私有化部署及云端托管,是提升 Agent 可观测性与稳定性的专业工具。