使用 HTML 敏捷包抓取
Scrape with HTML agility pack
我用 HTML agility pack
抓取了网页
但我不知道如何获取加载 javascript 的数据。
我知道 ChromeDriver
可能会有帮助,但我不想在我的应用程序中打开浏览器。实际上,我想让程序在用户界面后面抓取数据。
例如,我想抓取此 page 中的所有滑块图像
但图像由 JS 加载。所以 HTML 敏捷包无法捕捉到它。
您也可以使用无头 chrome 驱动程序。无头浏览器是自动化测试和服务器环境的绝佳工具,您不需要可见的 UI shell.
Chrome Chrome 59.x 及更高版本支持 Headless。
您可以使用 chrome headless 使用此代码
ChromeOptions option = new ChromeOptions();
option.AddArgument("--headless");
_driver = new ChromeDriver(option);
我用 HTML agility pack
抓取了网页
但我不知道如何获取加载 javascript 的数据。
我知道 ChromeDriver
可能会有帮助,但我不想在我的应用程序中打开浏览器。实际上,我想让程序在用户界面后面抓取数据。
例如,我想抓取此 page 中的所有滑块图像
但图像由 JS 加载。所以 HTML 敏捷包无法捕捉到它。
您也可以使用无头 chrome 驱动程序。无头浏览器是自动化测试和服务器环境的绝佳工具,您不需要可见的 UI shell.
Chrome Chrome 59.x 及更高版本支持 Headless。
您可以使用 chrome headless 使用此代码
ChromeOptions option = new ChromeOptions();
option.AddArgument("--headless");
_driver = new ChromeDriver(option);