用简单的 html dom 解析图像 src
parse image src with simple html dom
我正在尝试从此 link 获取源图像:https://www.scribd.com/book/348571030/The-Alice-Network-A-Novel
这是我没有的,但运气不好
<?php
include('simple_html_dom.php');
$html = file_get_html('https://www.scribd.com/book/348571030/The-Alice-Network-A-Novel');
$list = $html->find('div[class="class="auto__base_component auto__shared_react_document_image react_document_image""]',0);
$list_array = $list->find('img');
$list_array2['thumb'] = $list_array->find('img.loaded', 0)->src;
for ( $i = 0; $i < sizeof($list_array2); $i++ ){
echo $list_array2[$i]->plaintext;
echo "<br>";
}
?>
实际上,我使用 php class DOMDocument
通过获取该页面中的所有图像来完成它,然后你可以 select 你想要什么:
$html = file_get_contents('https://www.scribd.com/book/348571030/The-Alice-Network-A-Novel');
$doc = new DOMDocument();
$doc->loadHTML($html);
$images = $doc->getElementsByTagName('img');
foreach ($images as $image) {
echo $image->getAttribute('src') . "\n";
}
我猜如果你要找封面图,这是第三张图,所以如下所示:
echo $images[2]->getAttribute('src') . "\n";
我正在尝试从此 link 获取源图像:https://www.scribd.com/book/348571030/The-Alice-Network-A-Novel
这是我没有的,但运气不好
<?php
include('simple_html_dom.php');
$html = file_get_html('https://www.scribd.com/book/348571030/The-Alice-Network-A-Novel');
$list = $html->find('div[class="class="auto__base_component auto__shared_react_document_image react_document_image""]',0);
$list_array = $list->find('img');
$list_array2['thumb'] = $list_array->find('img.loaded', 0)->src;
for ( $i = 0; $i < sizeof($list_array2); $i++ ){
echo $list_array2[$i]->plaintext;
echo "<br>";
}
?>
实际上,我使用 php class DOMDocument
通过获取该页面中的所有图像来完成它,然后你可以 select 你想要什么:
$html = file_get_contents('https://www.scribd.com/book/348571030/The-Alice-Network-A-Novel');
$doc = new DOMDocument();
$doc->loadHTML($html);
$images = $doc->getElementsByTagName('img');
foreach ($images as $image) {
echo $image->getAttribute('src') . "\n";
}
我猜如果你要找封面图,这是第三张图,所以如下所示:
echo $images[2]->getAttribute('src') . "\n";