Watir-Webdriver 如何使用 Watir 浏览器在 Chrome 中获取嵌入式 pdf 文本
Watir-Webdriver how can I get embedded pdf text in Chrome using a Watir Browser
出于某种原因,我无法再在 Chrome 的内置 pdf 查看器中访问 PDF 文本。
@browser.text
=> ""
PDF 是嵌入的,我无法通过 Net/HTTP
获取或 curb
或 httparty
轻松获取它。但它在浏览器中显示得一清二楚...
我必须对 @browser.driver#some_method
做些什么吗?或者在 Watir::Browser.new :chrome
?
之前更改功能散列
随着最近对 Chrome 和 Chrome 驱动程序的更改,人们现在正在做什么来检查 Web 应用程序中的 PDF 文本?
Watir 非常适合处理 html,但不是为处理 pdf 等格式而设计的。如果你想解析 pdf 文件,你可以尝试 pdf-reader:
require 'pdf-reader'
require 'open-uri'
io = open(@browser.url)
reader = PDF::Reader.new(io)
reader.pages.first.text
出于某种原因,我无法再在 Chrome 的内置 pdf 查看器中访问 PDF 文本。
@browser.text
=> ""
PDF 是嵌入的,我无法通过 Net/HTTP
获取或 curb
或 httparty
轻松获取它。但它在浏览器中显示得一清二楚...
我必须对 @browser.driver#some_method
做些什么吗?或者在 Watir::Browser.new :chrome
?
随着最近对 Chrome 和 Chrome 驱动程序的更改,人们现在正在做什么来检查 Web 应用程序中的 PDF 文本?
Watir 非常适合处理 html,但不是为处理 pdf 等格式而设计的。如果你想解析 pdf 文件,你可以尝试 pdf-reader:
require 'pdf-reader'
require 'open-uri'
io = open(@browser.url)
reader = PDF::Reader.new(io)
reader.pages.first.text