网友回复
如果要访问互联网上的HTML网页,解析其中的图片链接,下载这些图片到本地,然后修改HTML中的图片URL为本地地址,你可以使用PHP的GuzzleHTTP库进行HTTP请求,并使用DOMDocument进行HTML解析。以下是具体实现步骤和示例代码。
示例代码1. 安装依赖确保安装了 GuzzleHTTP 库:
composer require guzzlehttp/guzzle2. 编写PHP脚本
<?php require 'vendor/autoload.php'; use GuzzleHttp\Client; use GuzzleHttp\Exception\RequestException; function downloadImages($html, $saveDir, $baseURL) { $client = new Client(); // 创建DOMDocument实例并加载HTML $dom = new DOMDocument; @$dom->loadHTML($html); // 获取所有的img标签 $images = $dom->getElementsByTagName('img'); foreach ($images as $img) { $url = $img->getAttribute('src'); // 如果URL是相对路径,则将其转换为绝对路径 if (!filter_var($url, FILTER_VALIDATE_URL)) { $url = rtrim($baseURL, '/') . '/' . ltrim($url, '/'); } // 获取图片文件名 $imageName = basename(parse_url($url, PHP_URL_PATH)); // 本地保存路径 $localPath = $saveDir . DIRECTORY_SEPARATOR . $imageName; try { // 下载图片并保存到本地 $response = $client->get($url, ['sink' => $localPath]); if ($response->getStatusCode() == 200) { // 替换img标签中的src属性 $img->setAttribute('src', $localPath); } } catch (RequestException $e) { echo "Failed to download $url: " . $e->getMessage(...
点击查看剩余70%