搜索

回答

两则有点不用，特别是selenium要注意顺序，还有参数设置，否则代理会无效。

requests

import requests

# 定义代理
proxies = {
    'http': 'http://代理ip或域名:端口',
    
}

# 定义请求头（可选）
headers = {
    'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) HeadlessChrome/86.0.4240.111 Safari/537.36'
}

# 发送GET请求
url = 'http://example.com'
response = requests.get(url, proxies=proxies, headers=headers)

# 打印响应内容
print(response.text)

selenium

#!/usr/local/python3/bin/python3
# -*- coding: utf-8 -*
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from time import sleep
from bs4 import BeautifulSoup
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import html

chromeOptions = webdriver.ChromeOptions()

# 添加代理参数
chromeOptions.add_argument('--proxy-server=http://代理ip或域名:端口')
#不要开启remote-debugging-port=9222，否则代理就会失效，headless也要放到后面
chromeOptions.add_argument("--headless")
#chromeOptions.add_argument("--remote-debugging-port=9222")
chromeOptions.add_argument('--no-sandbox')
browser = webdriver.Chrome('/usr/bin/chromedriver',chrome_options=chromeOptions)

browser.get("http://example.com")               #进入相关网站

try:
    sleep(1)

    html_content = browser.page_source
    
    # 使用BeautifulSoup解析网页内容
    #soup = BeautifulSoup(html_content, 'html.parser')
    print(html.escape(html_content))
    
    browser.quit()
    
    
finally:
    # 关闭浏览器
    browser.quit()

网友回复

我知道答案，我要回答

我有问题

私活外包

回答

开发了一个网站ai聊天助手

一个月开发一套类似coze的智能体平台

部署一套内网离线ai助理

私有ai助理开发

类似如家的租房app开发

h5手机端考试网站开发

开发一个短剧解锁剧集的小程序

我要开发一个酒类拍卖交易平台

开发艺术品拍卖收藏买画卖画h5网站

帮我做个数字货币交易所网站

ai生成软著软件著作权材料的ai提示词怎么写？

如何给网页富文本编辑器增加ai续写、ai润色优化等功能?

vue如何实现类似百度超级ai画布的ai笔记网页代码？

mongodb如何备份与恢复数据库？

有没有类似豆包pc端ai大模型编程代码块折叠右侧流式输出带预览的前后端代码？

nodejs有没有很快的目录爬虫和通配符文件查找库？

js如何流式输出ai的回答并折叠代码块，点击代码块右侧可预览代码？

ai大模型如何将文章转换成可视化一目了然的图片流程图图表？

大模型生成html版本的ui原型图和ppt演示文档的系统提示词怎么写？

rtsp视频直播流如何转换成websocket流在h5页面上观看？