+
95
-

有没有通过ai来进行数据爬虫爬取自己想要的数据的开源软件?

有没有通过ai来进行数据爬虫爬取自己想要的数据的开源软件?

告诉ai自己想要的数据,ai自动爬取对方的数据?

网友回复

+
15
-

试试Scrapegraph-ai 

Scrapegraph-ai 是一个基于大型语言模型(LLM)和代理工作流(Agent Workflow)构建的下一代网络爬虫,它利用了前沿的人工智能技术来提高网络数据抓取的效率和准确性。800_auto

支持 Groq、Llama3 等模型,Prompt 指挥抓取:这表明 Scrapegraph-ai 支持使用特定的查询语言(如 Groq)和大型语言模型(如 Llama3)来指导爬虫的行为。通过使用 Prompt(提示),用户可以更精确地控制爬虫抓取的内容,这使得爬虫能够更智能地理解和响应用户的需求。

支持 Playwright 处理 JS 渲染的网页:Playwright 是一个用于自动化跨浏览器测试的库,它支持无头模式,并且能够处理 JavaScript 渲染的网页。这意味着 Scrapegraph-ai 可以处理那些依赖于 JavaScript 动态加载内容的复杂网站,这对于传统的静态爬虫来说是一个挑战。

基于 graph builder 与 html、image、speech 节点可以自定义抓取和 pa...

点击查看剩余70%

+
15
-

Crawl4AI 是一个开源的、支持大型语言模型(LLM)的网络爬虫工具,用于提取网...

点击查看剩余70%

我知道答案,我要回答