搜索

selenium如何打开网页下载网页所有静态资源文件js css image等？

python

网友回复

1、创建一个http代理

2、浏览器设置代理服务器

3、获取js、css、图片等资源url并下载到本地

by thinkfuture

附上示例代码：

import socket

import select

import threading

import requests

import os

from urllib.parse import urlparse, urljoin

# 代理服务器监听IP和端口

host = "127.0.0.1"

port = 8081


# 最大连接数

max_connections = 100


# 缓存大小

buffer_size = 4096


# 初始化代理服务器

proxy_server = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

proxy_server.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)

proxy_server.bind((host, port))

proxy_server.listen(max_connections)

print(f"代理服务器已启动，监听地址：{host}:{port}")


def download_file(url, folder,headers):

    # 获取网页URL的路径和文件名

    parsed_url = urlparse(url)

    path_parts = parsed_url.path.split("/")

    if path_parts[-1] == "":

        filename = "index.html"

    else:

        filename = path_parts[-1]


    # 获取本地文件路径

    local_path = os.path.join(folder, *path_parts[1:-1])

    if not os.path.exists(local_path):

        os...

点击查看剩余70%

by thinkfuture

我知道答案，我要回答

我有问题

selenium如何打开网页下载网页所有静态资源文件js css image等？

什么是1-bit模型？

如何通过1公里内点对点的蓝牙通讯建立聊天系统？

ai意识空间j-空间到底是啥？

在powershell中运行Ubuntu的wsl2如何运行有ui窗体的python程序？

python如何提取视频中人物的深度信息？

如果ai不受控制攻击现有网络软件系统会怎么样？

未来的操作系统会不会都是基于ai吗？

kimi-k3与qwen-3.8及deepseek-v4正式版到底哪个更强？

veo与哦Omni免费体验网站哪有？

gemini免费api可以使用哪些模型和限制？