全部 未讀 (11783) ★ 收藏 (0) 🤖 人工智能 (7568) 📊 商业科技 (1784) 💻 软件编程 (1196) 📁 个人成长 (735) 🎨 产品设计 (208) 📁 生活文化 (108) 📁 投资财经 (71) 📁 媒体资讯 (69) 📁 AI 产品 (39) 📁 AI (5)
篩選中: 🏷️ 爬虫 共 22 篇 ✕ 清除篩選
11785
全部文章
11783
未讀
102
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (04-16 12:00)
BestBlogs 精選 (11766)

🏷️ 熱門標籤

AI Agent 1319 AI 智能体 732 Claude Code 643 Anthropic 621 LLM 563 OpenClaw 498 AI 编程 497 开源 438 AI 396 AI 安全 395 Claude 381 OpenAI 362 软件工程 354 开发者工具 341 生产力 308 GitHub 249 自动化 238 AI 基础设施 227 AI 开发 224 MCP 223
如何使用 Hermes Agent 稳定爬取公众号文章
📌 一句话摘要 本文详细介绍了如何利用 Hermes Agent 结合 Browser Use 或 CamoFox 两种浏览器自动化服务,封装一个稳定爬取微信公众号文章并自动写入飞书文档的 Skill。 📝 详细摘要 文章是一篇针对 Hermes Agent 用户的实践教程,核心内容是解决微信公
📅 2026-04-11 16:51 (4 天前) Draco 人工智能 2 分鐘 ★ 87
Hermes Agent Browser Use CamoFox 微信公众号爬虫
Cloudflare 与苏黎世联邦理工学院概述 AI 驱动的缓存优化方案
📌 一句话摘要 Cloudflare 与苏黎世联邦理工学院提出 AI 感知缓存策略,以应对高频、独特的 AI 爬虫流量带来的运营挑战和缓存抖动问题。 📝 详细摘要 Cloudflare 工程师与苏黎世联邦理工学院的研究人员发现,AI 驱动的爬虫流量每周已超过 100 亿次请求,这从根本上打破了传
📅 2026-04-08 22:20 (7 天前) Leela Kumili 软件编程 1 分鐘 ★ 88
CDN 缓存策略 AI 爬虫 RAG
为什么我们要为 AI 时代重新思考缓存机制
📌 一句话摘要 Cloudflare 正在重新设计 CDN 缓存架构,以缓解由 AI 爬虫独特的长尾访问模式所导致的破坏性缓存抖动。 📝 详细摘要 本文探讨了 AI 爬虫流量的激增如何从根本上挑战传统的 CDN 缓存策略。与人类用户不同,用于 RAG 和模型训练的 AI 机器人表现出激进、大容量
📅 2026-04-02 22:00 (13 天前) Avani Wildani 软件编程 2 分鐘 ★ 90
CDN 缓存算法 AI 爬虫 Cloudflare
Claude Code 反封号工具 cc-gateway 技术解析
📌 一句话摘要 针对 Claude Code 源码泄漏后的封号风险,cc-gateway 通过重写身份指纹和遥测数据实现反追踪。 📝 详细摘要 推文介绍了针对 Claude Code 的反封号工具 cc-gateway。该工具通过拦截并重写 Anthropic 的遥测事件(包括设备 ID、硬件指
📅 2026-04-01 10:11 (15 天前) AIGCLINK 人工智能 1 分鐘 ★ 86
ClaudeCode Anthropic AI工具 反爬虫
推荐一款 LLM 友好的爬虫工具:XCrawl
📌 一句话摘要 独立开发者推荐了一款名为 XCrawl 的爬虫工具,具备 LLM 友好的数据抓取能力,并提供慷慨的免费额度。 📝 详细摘要 该推文推荐了一款名为 XCrawl 的爬虫工具。作者指出其核心优势在于能够抓取单页并返回 LLM 友好的数据,同时支持全站抓取及 OpenClaw 技能扩展
📅 2026-03-30 17:00 (16 天前) Viking 软件编程 3 分鐘 ★ 81
XCrawl 爬虫 Web Scraping LLM
使用 XCrawl 增强 OpenClaw 数据采集能力
📌 一句话摘要 介绍了如何将 XCrawl 工具集成到 OpenClaw 中,通过四大核心功能提升 AI Agent 的数据采集效率。 📝 详细摘要 该推文分享了一个实用的技术工作流,通过将 XCrawl 的抓取、爬虫、地图探测和搜索功能集成到 OpenClaw 中,解决了动态网页抓取难的问题。
📅 2026-03-30 13:09 (17 天前) Berryxia.AI 人工智能 1 分鐘 ★ 76
XCrawl OpenClaw AI Agent 数据采集
现代网络爬虫工具对比分析
📌 一句话摘要 Browser Use 分享了一份热门网络爬虫工具的对比分析,旨在帮助开发者应对不断变化的数据提取环境。 📝 详细摘要 这条推文旨在引出对当前网络爬虫工具的对比研究。作者通过测试市面上最热门的解决方案,旨在为开发者提供关于当前环境下哪些工具最有效的见解,这对于构建 AI Agen
📅 2026-03-27 13:56 (19 天前) Browser Use 人工智能 1 分鐘 ★ 82
网络爬虫 AI Agent 开发者工具 数据提取
网络爬虫指南链接
📌 一句话摘要 本条推文提供了关于网络爬虫工具完整分析报告的直接链接。 📝 详细摘要 这是一条后续推文,包含了上一条推文中提到的《2026 年网络爬虫指南》的直接 URL。它作为主推文中预告内容的分发渠道。 📊 文章信息 AI 评分:80 来源:Browser Use(@browser_use
📅 2026-03-27 13:56 (19 天前) Browser Use 人工智能 1 分鐘 ★ 80
网络爬虫 指南 资源
推荐工具:bb-browser,利用 CDP 实现浏览器自动化抓取
📌 一句话摘要 宝玉推荐了 bb-browser 工具,该工具通过 Chrome 插件与 CDP 直接操控真实浏览器,有效绕过登录态与鉴权,实现高效数据抓取。 📝 详细摘要 宝玉转发并推荐了 `bb-browser` 工具。该工具的核心技术亮点在于利用 Chrome 插件结合 CDP(Chrom
📅 2026-03-25 14:36 (21 天前) 宝玉 软件编程 1 分鐘 ★ 83
bb-browser CDP 浏览器自动化 爬虫
利用 Firecrawl 构建 AI 智能体的数据基础设施
📌 一句话摘要 一份关于如何利用 Firecrawl 为 AI 智能体提供清洗后的结构化网页数据,从而构建垂直领域应用的实用指南。 📝 详细摘要 本文全面解析了 Firecrawl,这是一款旨在填补 AI 智能体与网页数据之间鸿沟的工具。文中详细介绍了浏览器沙箱、智能体端点以及结构化数据提取等核
📅 2026-03-25 04:36 (22 天前) GREG ISENBERG 人工智能 1 分鐘 ★ 81
Firecrawl AI 智能体 网页爬虫 数据基础设施
推荐开源工具:Lightnovel Crawler 网络小说抓取与电子书转换
📌 一句话摘要 推荐一款支持 361 个小说网站、可将网络小说批量下载并转换为多种电子书格式的开源工具 Lightnovel Crawler。 📝 详细摘要 Lightnovel Crawler 是一款功能强大的开源爬虫工具,专门用于抓取网络小说并将其转换为 EPUB、MOBI、PDF、DOCX
📅 2026-03-23 15:43 (23 天前) GitHubDaily 软件编程 3 分鐘 ★ 81
开源工具 爬虫 电子书 Lightnovel Crawler
HyperAgent:Playwright + 大模型实现自然语言浏览器自动化
📌 一句话摘要 GitHubDaily 推荐 HyperAgent 开源项目,将 Playwright 与大模型结合,通过自然语言控制浏览器完成自动化任务,解决传统选择器维护难题。 📝 详细摘要 该推文介绍了 GitHub 上的 HyperAgent 项目,巧妙地将 Playwright 与大语
📅 2026-03-22 12:00 (25 天前) GitHubDaily 软件编程 3 分鐘 ★ 79
自动化测试 爬虫 Playwright 大模型
主流网页爬虫工具实测对比与选型推荐
📌 一句话摘要 作者对比了多款开源及云端爬虫服务,推荐 Jina Reader 为性价比最高的云端选择,Crawl4AI 为最佳自建方案。 📝 详细摘要 推文分享了作者近期使用多种爬虫工具的实测经验。在云端服务方面,对比了 Firecrawl、Jina Reader、Cloudflare cra
📅 2026-03-15 20:20 (03-15 20:20) Viking 人工智能 3 分鐘 ★ 83
爬虫 Jina Reader Crawl4AI 数据采集
利用 CDP 与浏览器控制台绕过 API 签名校验的技术实现
📌 一句话摘要 通过 CDP 在浏览器控制台直接调用网页内部方法和 fetch,实现绕过复杂签名算法的数据抓取。 📝 详细摘要 作者分享了一种巧妙的 Agent 操作网页思路:通过 CDP (Chrome DevTools Protocol) 在浏览器控制台直接调用 `fetch` 或网页内部的
📅 2026-03-15 09:42 (03-15 09:42) yan5xu 人工智能 3 分鐘 ★ 86
CDP Agent 爬虫技术 小红书逆向
bb-browser:基于 CDP 的“作弊级”网页信息提取工具
📌 一句话摘要 一款通过 Chrome 插件和 CDP 直接操控真实浏览器,绕过登录与鉴权获取 50+ 网站信息的工具。 📝 详细摘要 作者发布了 bb-browser (badboy browser),这是一款创新的网页信息提取工具。其核心技术方案是通过 Chrome 插件结合 CDP (Ch
📅 2026-03-15 00:38 (03-15 00:38) yan5xu 人工智能 3 分鐘 ★ 88
bb-browser 浏览器自动化 CDP 爬虫技术
Lightpanda:专为 AI 和自动化打造的高性能轻量级无头浏览器
📌 一句话摘要 Lightpanda 是一款从零编写、内存占用仅为 Chrome 九分之一的高性能无头浏览器,原生兼容 Playwright 和 Puppeteer。 📝 详细摘要 推文介绍了一款名为 Lightpanda 的开源无头浏览器,旨在解决传统 Chromium 架构在数据抓取和自动化
📅 2026-03-14 08:00 (03-14 08:00) GitHubDaily 软件编程 3 分鐘 ★ 82
Lightpanda 无头浏览器 自动化测试 爬虫
Cloudflare 推出官方爬虫 API:从“反爬先锋”到“爬虫利器”的转变
📌 一句话摘要 Cloudflare 发布全新爬虫 API,支持全站自动化爬取、JS 渲染及增量更新,实现从反爬到爬虫的业务闭环。 📝 详细摘要 本推文关注了 Cloudflare 发布的重大产品更新:爬虫 API(Crawler API)。作为长期深耕反爬虫技术的服务商,Cloudflare
📅 2026-03-12 14:51 (03-12 14:51) Berryxia.AI 人工智能 1 分鐘 ★ 81
Cloudflare 爬虫 API 反爬虫 数据采集
Cloudflare 发布 Crawl API:支持整站爬取与结构化输出
📌 一句话摘要 Cloudflare 推出全新的爬虫 API,支持 JS 渲染、增量爬取,并可直接返回适用于 AI 的结构化数据。 📝 详细摘要 曾以反爬虫技术著称的 Cloudflare 跨界推出了官方爬虫工具 Crawl API。该工具功能强大,支持自动化整站爬取、动态网页渲染(如 Reac
📅 2026-03-12 10:34 (03-12 10:34) 小互 人工智能 3 分鐘 ★ 88
Cloudflare Crawl API 网络爬虫 数据采集
Cloudflare 推出站点爬取接口 /crawl,直接竞争 Firecrawl
📌 一句话摘要 Cloudflare 发布了新的 `/crawl` 端点,支持一键爬取全站并输出为 HTML、Markdown 或 JSON 格式。 📝 详细摘要 该推文关注 Cloudflare 开发者平台的一项重大更新:新增了 `/crawl` 接口。这一功能允许开发者通过单一 API 调用
📅 2026-03-11 12:29 (03-11 12:29) Fox@MkSaaS.com 人工智能 1 分鐘 ★ 82
Cloudflare Firecrawl 网络爬虫 数据采集
AI Agent 数据采集工具深度对比与实战建议
📌 一句话摘要 推文点评并分享了一份涵盖 MediaCrawler、jina-cli 等主流 AI 数据采集工具的实战对比指南。 📝 详细摘要 该推文转发并高度评价了一份关于 AI Agent 数据采集工具的深度分析。内容详细对比了 MediaCrawler(专注国内社交媒体)、Agent-Re
📅 2026-03-11 14:41 (03-11 14:41) Berryxia.AI 人工智能 4 分鐘 ★ 82
AI Agent 数据采集 爬虫工具 MediaCrawler