PHP 简单 HTML DOM:如何找到 Javascript 中存在的网址
PHP Simple HTML DOM: How Do I Find Urls Exist In Javascript
PHP:我正在使用 Simple Html Dom Parser 解析一些页面,我已经做了很多工作,但卡在了一个点上。
如何获取驻留在 javascript 函数中的 url。 (网址是随机的)像这样
<script>
lstImages = array();
lstImages.push("abc.com/123873.php");
lstImages.push("abc.com/125673.php");
</script>
我应该如何获得它们?它们的数量可以是随机的,有些页面有 20 个,有些有 25 个等等。
不胜感激,我已经精疲力尽了。
示例代码:
require "simple_html_dom.php";
$html = file_get_html('pages.html');
$file = fopen("links.txt","w");
foreach($html->find('a') as $link) {
echo fwrite($file,$link->href."\n");
}
由于您不能使用 DOM 解析器来抓取 Javascript,您可以使用正则表达式来做到这一点。
使用这个:
$html = file_get_html('pages.html');
$re = "/push\(\"(.*)\"\)/";
$str = $html;
preg_match_all($re, $str, $matches);
$matches 现在包含一个包含您的 URL 的数组。
PHP:我正在使用 Simple Html Dom Parser 解析一些页面,我已经做了很多工作,但卡在了一个点上。
如何获取驻留在 javascript 函数中的 url。 (网址是随机的)像这样
<script>
lstImages = array();
lstImages.push("abc.com/123873.php");
lstImages.push("abc.com/125673.php");
</script>
我应该如何获得它们?它们的数量可以是随机的,有些页面有 20 个,有些有 25 个等等。
不胜感激,我已经精疲力尽了。
示例代码:
require "simple_html_dom.php";
$html = file_get_html('pages.html');
$file = fopen("links.txt","w");
foreach($html->find('a') as $link) {
echo fwrite($file,$link->href."\n");
}
由于您不能使用 DOM 解析器来抓取 Javascript,您可以使用正则表达式来做到这一点。
使用这个:
$html = file_get_html('pages.html');
$re = "/push\(\"(.*)\"\)/";
$str = $html;
preg_match_all($re, $str, $matches);
$matches 现在包含一个包含您的 URL 的数组。