+
95
-

php如何自动解析下载html文档中图片变成本地地址?

php
php如何自动解析下载html文档中图片变成本地地址?

网友回复

+
15
-

如果要访问互联网上的HTML网页,解析其中的图片链接,下载这些图片到本地,然后修改HTML中的图片URL为本地地址,你可以使用PHP的GuzzleHTTP库进行HTTP请求,并使用DOMDocument进行HTML解析。以下是具体实现步骤和示例代码。

示例代码1. 安装依赖

确保安装了 GuzzleHTTP 库:

composer require guzzlehttp/guzzle
2. 编写PHP脚本
<?php
require 'vendor/autoload.php';

use GuzzleHttp\Client;
use GuzzleHttp\Exception\RequestException;

function downloadImages($html, $saveDir, $baseURL) {
    $client = new Client();

    // 创建DOMDocument实例并加载HTML
    $dom = new DOMDocument;
    @$dom->loadHTML($html);

    // 获取所有的img标签
    $images = $dom->getElementsByTagName('img');

    foreach ($images as $img) {
        $url = $img->getAttribute('src');

        // 如果URL是相对路径,则将其转换为绝对路径
        if (!filter_var($url, FILTER_VALIDATE_URL)) {
            $url = rtrim($baseURL, '/') . '/' . ltrim($url, '/');
        }

        // 获取图片文件名
        $imageName = basename(parse_url($url, PHP_URL_PATH));

        // 本地保存路径
        $localPath = $saveDir . DIRECTORY_SEPARATOR . $imageName;

        try {
            // 下载图片并保存到本地
            $response = $client->get($url, ['sink' => $localPath]);
            if ($response->getStatusCode() == 200) {
                // 替换img标签中的src属性
                $img->setAttribute('src', $localPath);
            }
        } catch (RequestException $e) {
            echo "Failed to download $url: " . $e->getMessage(...

点击查看剩余70%

我知道答案,我要回答