PHP 简单 HTML DOM：如何找到 Javascript 中存在的网址

Question

PHP：我正在使用 Simple Html Dom Parser 解析一些页面，我已经做了很多工作，但卡在了一个点上。

如何获取驻留在 javascript 函数中的 url。（网址是随机的）像这样

<script> 
    lstImages = array();   
    lstImages.push("abc.com/123873.php");
    lstImages.push("abc.com/125673.php");
</script>

我应该如何获得它们？它们的数量可以是随机的，有些页面有 20 个，有些有 25 个等等。

不胜感激，我已经精疲力尽了。

示例代码：

require "simple_html_dom.php";
$html = file_get_html('pages.html');

$file = fopen("links.txt","w");
foreach($html->find('a') as $link) {
    echo fwrite($file,$link->href."\n");
}

Answer 1

由于您不能使用 DOM 解析器来抓取 Javascript，您可以使用正则表达式来做到这一点。

使用这个：

$html = file_get_html('pages.html');

$re = "/push\(\"(.*)\"\)/"; 
$str = $html;

preg_match_all($re, $str, $matches);

$matches 现在包含一个包含您的 URL 的数组。

PHP 简单 HTML DOM：如何找到 Javascript 中存在的网址

PHP Simple HTML DOM: How Do I Find Urls Exist In Javascript

html

javascript

php

jquery

simple-html-dom