Watir-Webdriver 如何使用 Watir 浏览器在 Chrome 中获取嵌入式 pdf 文本

Watir-Webdriver how can I get embedded pdf text in Chrome using a Watir Browser

出于某种原因,我无法再在 Chrome 的内置 pdf 查看器中访问 PDF 文本。

@browser.text
=> ""

PDF 是嵌入的,我无法通过 Net/HTTP 获取或 curbhttparty 轻松获取它。但它在浏览器中显示得一清二楚...

我必须对 @browser.driver#some_method 做些什么吗?或者在 Watir::Browser.new :chrome?

之前更改功能散列

随着最近对 Chrome 和 Chrome 驱动程序的更改,人们现在正在做什么来检查 Web 应用程序中的 PDF 文本?

Watir 非常适合处理 html,但不是为处理 pdf 等格式而设计的。如果你想解析 pdf 文件,你可以尝试 pdf-reader:

require 'pdf-reader'
require 'open-uri'

io = open(@browser.url)
reader = PDF::Reader.new(io)
reader.pages.first.text