如何使用 JavaScript 检测抓取网站

How to scrape a website with JavaScript detection

我正在使用 Guzzle library 抓取一个网站以从 HTML 中提取特定数据。但是现在,在浏览器启用 JavaScript 之前,网站不会显示内容。

所以现在我被这些问题困住了:

  1. guzzle 客户端可以模拟启用 javascript 吗?
  2. PHP 语言(除 Guzzle 之外)是否有任何其他工具可以帮助解决这个问题?

欢迎任何建议。

您可以使用 selenium 来自动化浏览器。

参考How to use Selenium with PHP?在php中使用。

也可以参考Selenium PHP Tutorial