c

crawl4ai

by unclecode
🔓 开源项目 Python 🌍 全球 freemium

介绍

Crawl4AI 是一款由 unclecode 开发的开源网页爬虫与抓取工具,专为大模型(LLM)和 AI Agent 优化。它能通过异步浏览器池高效地将网页转换为干净的 Markdown,支持反爬检测、Shadow DOM 解析和媒体提取。结合各类主流 LLM,它可以精准提取结构化数据,极度适用于 RAG 与数据管道构建。该工具支持 CLI 和 Docker 部署,兼具极高运行效率与全方位浏览器控制能力。

功能特征

  • 大模型友好的纯净 Markdown 输出
  • 支持各类 LLM 的结构化数据智能提取
  • 高效的异步浏览器池与动态内容抓取
  • 内置自动三层反爬虫检测与隐身模式
  • 灵活提供 CLI、Docker 及 FastAPI 部署方案

支持平台

webdesktop