selenium如何获取网页js加载渲染后的真实dom结构?
网友回复
Selenium 默认获取的就是 JS 渲染后的真实 DOM,但关键在于 等待时机。如果在 JS 执行完成前调用获取方法,拿到的仍是初始 HTML。
下面提供一套生产环境常用的 Python 示例,包含显式等待、DOM 获取方式及注意事项:
完整示例代码(Python + Selenium 4)
from urllib.parse import urljoin, urlparse
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
def get_rendered_dom_with_resolved_urls(target_url: str, wait_selector: tuple = (By.TAG_NAME, "body")):
# Selenium 4.6+ 已内置驱动自动管理,直接调用即可
chromeOptions = webdriver.ChromeOptions()
chromeOptions.add_argument("--headless")
chromeOptions.add_argument("--remote-debugging-port=9222")
chromeOptions.add_a...点击查看剩余70%
ai能写出比黑客还厉害的零日漏洞等攻击工具攻击任意软件系统工程?
js如何获取浏览器的音频上下文指纹、Canvas指纹、WebGL渲染特征?
为啥ai开始抛弃markdown文本,重新偏好html文本了?
网站有没有办法鉴别访问请求是由ai操控chrome-devtools-mcp发出的?
有没有python自动操作浏览器让网站无法鉴别是机器行为?
为啥最新由Meta / 斯坦福 / 哈佛出的ProgramBench基准GPT-5.4、Claude Opus 4.7、Gemini 3.1 Pro 等全部 0% 通过率?
有没有免费的api查询域名是否完成icp工信部备案?
codex用HyperFrames与 Remotion自动做视频那个更好?
claude code中Skill MCP CLI SubAgent Hooks Plugin区别?
浏览器webrtc点对点通讯如何才能走系统代理?


