PHP 中的简单 HTML Dom 解析器使元素不可读的最简单方法
Easiest Way Of Getting Elements Unreadable by Simple HTML Dom Parser in PHP
假设一个简单的 Web 应用程序(如下所示)使用简单 HTML Dom 解析器运行。
<?php
include('simple_html_dom.php');
$html = file_get_html('http://someurl.com');
echo $html;
?>
正如预期的那样,除了一个元素,class .addedDiv
的 div
,它似乎是由 JS 注入的。以最简单和最具包容性的方式,你能否演示如何用最少的代码检索一个元素,希望有一个例子,
(update ) 最好是内联的并且对大多数人来说易于实施,无论是 PHP、AJAX,还是我不知道的 iFrame hack?在此先感谢您提供的所有帮助。
更新:
此外,如果有帮助,我实际上不需要(或不想)将它与其他所有内容一起输出。我只需要它的一个属性来模拟一些额外的功能。因此,如果有任何区别,我不需要将网站的所有内容输出到屏幕的“$html”(如果我这样做,我只需要使用 iframe)。
我想你可以使用 phantomjs 模块。你需要安装它。
phantomjs 是命令行实用程序,因此在 php 中您可以通过 exec()
命令执行它并获得预期的 foutput。
要了解更多,您需要了解如何从此处 http://phantomjs.org/api/webpage/property/content.html
了解如何在 JS 修改后获取 HTML 的内容
假设一个简单的 Web 应用程序(如下所示)使用简单 HTML Dom 解析器运行。
<?php
include('simple_html_dom.php');
$html = file_get_html('http://someurl.com');
echo $html;
?>
正如预期的那样,除了一个元素,class .addedDiv
的 div
,它似乎是由 JS 注入的。以最简单和最具包容性的方式,你能否演示如何用最少的代码检索一个元素,希望有一个例子,
(update ) 最好是内联的并且对大多数人来说易于实施,无论是 PHP、AJAX,还是我不知道的 iFrame hack?在此先感谢您提供的所有帮助。
更新:
此外,如果有帮助,我实际上不需要(或不想)将它与其他所有内容一起输出。我只需要它的一个属性来模拟一些额外的功能。因此,如果有任何区别,我不需要将网站的所有内容输出到屏幕的“$html”(如果我这样做,我只需要使用 iframe)。
我想你可以使用 phantomjs 模块。你需要安装它。
phantomjs 是命令行实用程序,因此在 php 中您可以通过 exec()
命令执行它并获得预期的 foutput。
要了解更多,您需要了解如何从此处 http://phantomjs.org/api/webpage/property/content.html
了解如何在 JS 修改后获取 HTML 的内容