第 4 课 — 云服务 vs 本地自建:如何选择?
💡 进群学习加 wx: agentupdate
(申请发送: agentupdate)
(申请发送: agentupdate)
在决定使用 Firecrawl 云服务还是本地自建前,你需要从功能、性能和成本三个维度进行权衡。
4.1 功能差异矩阵
| 功能 | 云服务 (Cloud) | 本地自建 (Self-Hosted) |
|---|---|---|
| 基础抓取 (Scrape) | ✅ 完整支持 | ✅ 完整支持 |
| 搜索引擎 (Search) | ✅ 内置支持 | ❌ 需自备搜索 API |
| 自主研究 (Agent) | ✅ 独有功能 | ❌ 不支持 |
| 住宅代理池 | ✅ 内置三级代理 | ❌ 需自备代理 |
| 结构化提取 (LLM) | ✅ 零配置使用 | ⚠️ 需自备 LLM API Key |
| 浏览器交互 | ✅ 零配置使用 | ⚠️ 需部署 Playwright 微服务 |
| 维护成本 | 零维护 | 需持续维护服务器 |
4.2 计费模型与成本
云服务计费 (Credits)
Firecrawl 云服务使用 Credit(积分) 系统。通常情况下,1 credit 对应 1 页抓取。
- Scrape/Crawl/Map:1 credit / 页。
- Search:2 credits / 10 条结果。
- Interact:2 credits / 浏览器分钟。
成本分析
- 云服务:Hobby 套餐 ($19/月) 包含 3,000 页,适合中小规模或需要快速落地的项目。
- 本地自建:你需要承担服务器费用(约 $20-$100/月)和代理 IP 费用。只有当月抓取量超过 50 万页时,本地自建才具有显著的经济优势。
4.3 选择决策树
你可以根据以下逻辑快速做出决定:
- 你需要搜索 (Search) 功能吗?
- 是 → 首选云服务(本地自建不含搜索索引)。
- 月抓取量是否小于 10 万页?
- 是 → 首选云服务(省去运维精力)。
- 数据是否有极高的隐私合规要求?
- 是 → 必须本地自建。
- 是否有强大的运维能力且追求极致低成本?
- 是 → 本地自建。
4.4 省钱小技巧 (云服务)
- 开启缓存:使用
storeInCache: true,在有效期内重复请求相同 URL 不消耗 Credit。 - 定向抓取:使用 Map 先发现 URL,再通过
includeTags只抓取核心正文,减少下游 token 消耗(虽然不直接省 credit,但省 AI 费用)。 - 去除图片:设置
removeBase64Images: true可以显著加快响应速度。