使用 ruby 抓取动态内容

crawling dynamic content using ruby

我正在使用 ruby gems(nokogiri 和 mechanize)为网站制作爬虫,但该网站包含 bootstrap 模态(弹出式 windows),它是在单击按钮时动态生成的.

此内容(模态)显示在某些 URL 上使用 "get" 方法的按钮单击上。

我通过抓取与按钮关联的 URL 获得响应 但我只是得到相同的页面源。

如何使用 "ruby" 获取该动态内容的内容?

你说的那个模态很有可能是用Js渲染的。所以你要找的是不可能的,因为提到的库不执行 Js.

为了解析内容依赖于Js的页面,您应该使用其他工具,例如puppeteer