crawl4ai
by unclecode
介绍
Crawl4AI 是一款由 unclecode 开发的开源网页爬虫与抓取工具,专为大模型(LLM)和 AI Agent 优化。它能通过异步浏览器池高效地将网页转换为干净的 Markdown,支持反爬检测、Shadow DOM 解析和媒体提取。结合各类主流 LLM,它可以精准提取结构化数据,极度适用于 RAG 与数据管道构建。该工具支持 CLI 和 Docker 部署,兼具极高运行效率与全方位浏览器控制能力。
功能特征
- 大模型友好的纯净 Markdown 输出
- 支持各类 LLM 的结构化数据智能提取
- 高效的异步浏览器池与动态内容抓取
- 内置自动三层反爬虫检测与隐身模式
- 灵活提供 CLI、Docker 及 FastAPI 部署方案
支持平台
webdesktop