用简单的 html dom 解析图像 src

Question

我正在尝试从此 link 获取源图像：https://www.scribd.com/book/348571030/The-Alice-Network-A-Novel

这是我没有的，但运气不好

<?php

 include('simple_html_dom.php');

 $html = file_get_html('https://www.scribd.com/book/348571030/The-Alice-Network-A-Novel');

 $list = $html->find('div[class="class="auto__base_component auto__shared_react_document_image react_document_image""]',0);

 $list_array = $list->find('img');

 $list_array2['thumb']  = $list_array->find('img.loaded', 0)->src;

 for ( $i = 0; $i < sizeof($list_array2); $i++ ){
  echo $list_array2[$i]->plaintext;
  echo "<br>";
 }

?>

Answer 1

实际上，我使用 php class DOMDocument 通过获取该页面中的所有图像来完成它，然后你可以 select 你想要什么：

$html = file_get_contents('https://www.scribd.com/book/348571030/The-Alice-Network-A-Novel');
$doc = new DOMDocument();
$doc->loadHTML($html);
$images = $doc->getElementsByTagName('img');
foreach ($images as $image) {
    echo $image->getAttribute('src') . "\n";
}

我猜如果你要找封面图，这是第三张图，所以如下所示：

echo $images[2]->getAttribute('src') . "\n";

用简单的 html dom 解析图像 src

parse image src with simple html dom

php

html-parsing