搜索

有没有通过ai来进行数据爬虫爬取自己想要的数据的开源软件？

人工智能其他

告诉ai自己想要的数据，ai自动爬取对方的数据？

网友回复

试试Scrapegraph-ai

Scrapegraph-ai 是一个基于大型语言模型（LLM）和代理工作流（Agent Workflow）构建的下一代网络爬虫，它利用了前沿的人工智能技术来提高网络数据抓取的效率和准确性。 800_auto

支持 Groq、Llama3 等模型，Prompt 指挥抓取：这表明 Scrapegraph-ai 支持使用特定的查询语言（如 Groq）和大型语言模型（如 Llama3）来指导爬虫的行为。通过使用 Prompt（提示），用户可以更精确地控制爬虫抓取的内容，这使得爬虫能够更智能地理解和响应用户的需求。

支持 Playwright 处理 JS 渲染的网页：Playwright 是一个用于自动化跨浏览器测试的库，它支持无头模式，并且能够处理 JavaScript 渲染的网页。这意味着 Scrapegraph-ai 可以处理那些依赖于 JavaScript 动态加载内容的复杂网站，这对于传统的静态爬虫来说是一个挑战。

基于 graph builder 与 html、image、speech 节点可以自定义抓取和 pa...

点击查看剩余70%

by python

Crawl4AI 是一个开源的、支持大型语言模型（LLM）的网络爬虫工具，用于提取网...

点击查看剩余70%

by ai世界

我知道答案，我要回答

我有问题

私活外包

有没有通过ai来进行数据爬虫爬取自己想要的数据的开源软件？

开发了一个网站ai聊天助手

一个月开发一套类似coze的智能体平台

部署一套内网离线ai助理

私有ai助理开发

类似如家的租房app开发

h5手机端考试网站开发

开发一个短剧解锁剧集的小程序

我要开发一个酒类拍卖交易平台

开发艺术品拍卖收藏买画卖画h5网站

帮我做个数字货币交易所网站

ai生成软著软件著作权材料的ai提示词怎么写？

如何给网页富文本编辑器增加ai续写、ai润色优化等功能?

vue如何实现类似百度超级ai画布的ai笔记网页代码？

mongodb如何备份与恢复数据库？

有没有类似豆包pc端ai大模型编程代码块折叠右侧流式输出带预览的前后端代码？

nodejs有没有很快的目录爬虫和通配符文件查找库？

js如何流式输出ai的回答并折叠代码块，点击代码块右侧可预览代码？

ai大模型如何将文章转换成可视化一目了然的图片流程图图表？

大模型生成html版本的ui原型图和ppt演示文档的系统提示词怎么写？

rtsp视频直播流如何转换成websocket流在h5页面上观看？