云视觉 API - PDF OCR
Cloud Vision API - PDF OCR
我刚刚测试了 Google Cloud Vision API 以读取图像中的文本(如果存在)。
到目前为止,我安装了 Maven 服务器和 Redis 服务器。我只是按照此页面中的说明进行操作。
https://github.com/GoogleCloudPlatform/cloud-vision/tree/master/java/text
到目前为止,我可以使用 .jpg 文件进行测试,是否可以使用 tiff 文件或 pdf 文件进行测试?
我正在使用以下命令:
java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar com.google.cloud.vision.samples.text.TextApp ../../data/text/
在text目录里面,我有jpg格式的文件。
然后读取转换后的文件,我不知道该怎么做,只是我 运行 下面的命令
java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar com.google.cloud.vision.samples.text.TextApp
然后我收到消息,要求我输入要在转换后的文件中搜索的字词或短语。有没有办法查看整个文档的转换?
谢谢!
2016 年,Cloud Vision 不支持 PDF 和 TIFF 格式。
接受的格式是:(取自doc)
- JPEG
- PNG8
- PNG24
- 动图
- 动画 GIF(仅第一帧)
- BMP
- WEBP
- RAW
- ICO
不过现在都加了。
jpg
的文档:
https://cloud.google.com/vision/docs/ocr
pdf
的文档
https://cloud.google.com/vision/docs/pdf
我知道这个问题很老了,但现在 Google Vision 发布了对 PDF 的支持!
2018 年 4 月 6 日,文档文本检测中对 PDF 和 TIFF 文件的支持已添加到 Google Cloud愿景 API(参见 Release Notes)。
根据 documentation:
Vision API 可以检测和转录来自 PDF 和 TIFF 的文本
存储在 Google Cloud Storage.
中的文件
必须使用
asyncBatchAnnotate 函数,它执行异步请求 并使用操作资源提供其状态。
来自 PDF/TIFF 请求的 输出 被写入在指定的 [= 中创建的 JSON 文件85=] 云存储桶.
示例:
1) 将文件上传到您的 Google 云存储
2) 发出POST请求执行PDF/TIFF文档文本检测
要求:
POST https://vision.googleapis.com/v1p2beta1/files:asyncBatchAnnotate
Authorization: Bearer <your access token>
{
"requests":[
{
"inputConfig": {
"gcsSource": {
"uri": "gs://<your bucket name>/input.pdf"
},
"mimeType": "application/pdf"
},
"features": [
{
"type": "DOCUMENT_TEXT_DETECTION"
}
],
"outputConfig": {
"gcsDestination": {
"uri": "gs://<your bucket name>/output/"
},
"batchSize": 1
}
}
]
}
回复:
{
"name": "operations/9b1f9d773d216406"
}
3) 发起GET请求检查文档文本检测是否完成
要求:
GET https://vision.googleapis.com/v1/operations/9b1f9d773d216406
Authorization: Bearer <your access token>
回复:
{
"name": "operations/9b1f9d773d216406",
"metadata": {
"@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.OperationMetadata",
"state": "RUNNING",
"updateTime": "2018-06-17T20:18:09.117787733Z"
},
"done": true,
"response": {
"@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.AsyncBatchAnnotateFilesResponse",
"responses": [
{
"outputConfig": {
"gcsDestination": {
"uri": "gs://<your bucket name>/output/"
},
"batchSize": 1
}
}
]
}
}
4) 在指定的 Google Cloud Storage 文件夹中检查结果
现在 google 云视觉文本检测也可用于 pdf 文件,它以同步方式立即检测 pdf 文件中的文本并且不需要文件在 google 存储中它可以采用 base 64 格式。
HTTP 方法和 URL:
POST https://vision.googleapis.com/v1/files:annotate
请求 JSON 正文:
{
"requests": [
{
"inputConfig": {
"content": "base64-encoded-file",
"mimeType": "application/pdf"
},
"features": [
{
"type": "DOCUMENT_TEXT_DETECTION"
}
],
"pages": [
1,2,3,4,5
]
}
]
}
有关它的更多信息,请访问 https://cloud.google.com/vision/docs/file-small-batch
我刚刚测试了 Google Cloud Vision API 以读取图像中的文本(如果存在)。
到目前为止,我安装了 Maven 服务器和 Redis 服务器。我只是按照此页面中的说明进行操作。
https://github.com/GoogleCloudPlatform/cloud-vision/tree/master/java/text
到目前为止,我可以使用 .jpg 文件进行测试,是否可以使用 tiff 文件或 pdf 文件进行测试?
我正在使用以下命令:
java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar com.google.cloud.vision.samples.text.TextApp ../../data/text/
在text目录里面,我有jpg格式的文件。
然后读取转换后的文件,我不知道该怎么做,只是我 运行 下面的命令
java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar com.google.cloud.vision.samples.text.TextApp
然后我收到消息,要求我输入要在转换后的文件中搜索的字词或短语。有没有办法查看整个文档的转换?
谢谢!
2016 年,Cloud Vision 不支持 PDF 和 TIFF 格式。
接受的格式是:(取自doc)
- JPEG
- PNG8
- PNG24
- 动图
- 动画 GIF(仅第一帧)
- BMP
- WEBP
- RAW
- ICO
不过现在都加了。
jpg
的文档:
https://cloud.google.com/vision/docs/ocr
pdf
https://cloud.google.com/vision/docs/pdf
我知道这个问题很老了,但现在 Google Vision 发布了对 PDF 的支持!
2018 年 4 月 6 日,文档文本检测中对 PDF 和 TIFF 文件的支持已添加到 Google Cloud愿景 API(参见 Release Notes)。
根据 documentation:
Vision API 可以检测和转录来自 PDF 和 TIFF 的文本 存储在 Google Cloud Storage.
中的文件必须使用 asyncBatchAnnotate 函数,它执行异步请求 并使用操作资源提供其状态。
来自 PDF/TIFF 请求的 输出 被写入在指定的 [= 中创建的 JSON 文件85=] 云存储桶.
示例:
1) 将文件上传到您的 Google 云存储
2) 发出POST请求执行PDF/TIFF文档文本检测
要求:
POST https://vision.googleapis.com/v1p2beta1/files:asyncBatchAnnotate
Authorization: Bearer <your access token>
{
"requests":[
{
"inputConfig": {
"gcsSource": {
"uri": "gs://<your bucket name>/input.pdf"
},
"mimeType": "application/pdf"
},
"features": [
{
"type": "DOCUMENT_TEXT_DETECTION"
}
],
"outputConfig": {
"gcsDestination": {
"uri": "gs://<your bucket name>/output/"
},
"batchSize": 1
}
}
]
}
回复:
{
"name": "operations/9b1f9d773d216406"
}
3) 发起GET请求检查文档文本检测是否完成
要求:
GET https://vision.googleapis.com/v1/operations/9b1f9d773d216406
Authorization: Bearer <your access token>
回复:
{
"name": "operations/9b1f9d773d216406",
"metadata": {
"@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.OperationMetadata",
"state": "RUNNING",
"updateTime": "2018-06-17T20:18:09.117787733Z"
},
"done": true,
"response": {
"@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.AsyncBatchAnnotateFilesResponse",
"responses": [
{
"outputConfig": {
"gcsDestination": {
"uri": "gs://<your bucket name>/output/"
},
"batchSize": 1
}
}
]
}
}
4) 在指定的 Google Cloud Storage 文件夹中检查结果
现在 google 云视觉文本检测也可用于 pdf 文件,它以同步方式立即检测 pdf 文件中的文本并且不需要文件在 google 存储中它可以采用 base 64 格式。
HTTP 方法和 URL:
POST https://vision.googleapis.com/v1/files:annotate 请求 JSON 正文:
{
"requests": [
{
"inputConfig": {
"content": "base64-encoded-file",
"mimeType": "application/pdf"
},
"features": [
{
"type": "DOCUMENT_TEXT_DETECTION"
}
],
"pages": [
1,2,3,4,5
]
}
]
}
有关它的更多信息,请访问 https://cloud.google.com/vision/docs/file-small-batch