r

ragas

by vibrantlabsai
🔓 开源项目 Python 🌍 全球 free

介绍

Ragas 是一个由 vibrantlabsai 开发的开源 Python 库,专为评估和优化大型语言模型(LLM)应用而设计。它通过提供客观的评估指标(包括基于LLM和传统指标)、智能测试集生成以及数据驱动的洞察,帮助开发者摆脱主观、耗时的评估流程。Ragas 能够自动创建覆盖广泛场景的测试数据集,并能与 LangChain 等流行LLM框架以及主流可观测工具无缝集成,从而构建生产数据驱动的持续改进反馈循环。

功能特征

  • 提供客观的LLM和传统评估指标
  • 自动化生成全面测试数据集
  • 与主流LLM框架和观测工具无缝集成
  • 支持生产数据驱动的反馈循环
  • 可扩展的自定义评估器

支持平台

webdesktop