是否可以导入 PDF 文件的光栅?
Is it possible to import a raster of a PDF file?
我们的办公室会扫描数据录入表格,我们缺少任何能够进行自动复式录入的专有软件(当然,主要录入是手工完成的)。我们希望为研究人员提供一种工具,以突出显示表格上的区域并使用扫描版本来确定参与者输入的内容。
要做到这一点,我需要做一个非常粗略的尝试,就是将 PDF 作为光栅文件读取,坐标作为 X、Y 分量,黑白白色 "intensities" 作为 Z 轴。
我们主要使用 R 进行统计分析和数据管理,所以 R 中的选项会很棒。
您可以使用 R 中的栅格包。但是,它不支持 .pdf 文件,但支持 .tif、.jpg、.png(以及许多其他文件)。
但是将 pdf 转换为 png 应该不是什么大问题:查看 here 了解更多信息。
准备好 png 文件后,您可以执行以下操作:
png <- raster("your/png/file.png")
然后使用extract()
函数从图片中获取亮度值。 IE。假设您的 png 是 200x200px,并且您想从第 100 行和第 150 列中提取像素值:
value <- extract(png, c(150,100))
我们的办公室会扫描数据录入表格,我们缺少任何能够进行自动复式录入的专有软件(当然,主要录入是手工完成的)。我们希望为研究人员提供一种工具,以突出显示表格上的区域并使用扫描版本来确定参与者输入的内容。
要做到这一点,我需要做一个非常粗略的尝试,就是将 PDF 作为光栅文件读取,坐标作为 X、Y 分量,黑白白色 "intensities" 作为 Z 轴。
我们主要使用 R 进行统计分析和数据管理,所以 R 中的选项会很棒。
您可以使用 R 中的栅格包。但是,它不支持 .pdf 文件,但支持 .tif、.jpg、.png(以及许多其他文件)。 但是将 pdf 转换为 png 应该不是什么大问题:查看 here 了解更多信息。
准备好 png 文件后,您可以执行以下操作:
png <- raster("your/png/file.png")
然后使用extract()
函数从图片中获取亮度值。 IE。假设您的 png 是 200x200px,并且您想从第 100 行和第 150 列中提取像素值:
value <- extract(png, c(150,100))