Google Cloud Vision API PDF 文本提取

Posted

技术标签:

【中文标题】Google Cloud Vision API PDF 文本提取【英文标题】:Google Cloud Vision API PDF text extraction 【发布时间】:2019-02-05 03:46:01 【问题描述】:

我正在尝试使用谷歌文档https://cloud.google.com/vision/docs/pdf 中提供的 python 代码从 pdf(图像转换为 pdf)中提取文本。 如文档中所述,我已经创建了服务帐户密钥并将其用于身份验证,并且我在我的 PC 中使用了 google SDK。代码超时并出现以下错误:

File "C:\*****\pdf_code.py", line 39, in async_detect_document
operation.result(timeout=180)   File "C:\Python27\lib\site-packages\google\api_core\future\polling.py", line 120, in result
raise self._exception google.api_core.exceptions.GoogleAPICallError: None Error writing final output to: gs://******/output-1-to-1.json

任何帮助将不胜感激。

【问题讨论】:

【参考方案1】:

我遇到了类似的错误,我正在使用服务帐户访问 Cloud vision api 并在我的本地使用服务帐户密钥

我通过授予相同的服务帐户写入存储桶的权限解决了上述错误 ->

导航到 console.cloud.google.com storage->browser --> 导航到要存储输出文件的存储桶 选择权限选项卡 --> 点击“添加成员”按钮 在“新成员”文本框中提及您的服务帐户——类似 "xyz-vision-api@your_project_name.iam.gserviceaccount.com" 选择存储管理员角色 保存

您的错误应该得到解决

【讨论】:

【参考方案2】:

上面写着:Error writing final output to: gs://******/output-1-to-1.json

...您可能需要在本地安装gcloudgsutil;还要检查存储桶ACL

gcloud 未登录或gsutil 不可用时,这不会写入存储桶。

【讨论】:

以上是关于Google Cloud Vision API PDF 文本提取的主要内容,如果未能解决你的问题,请参考以下文章

Google Cloud Vision API PDF 文本提取

如何提高google cloud vision api的处理速度?

Google Cloud Vision API“错误的图像数据”错误

PHP Google Cloud Vision API:注释立即淹没内存

应用程序凭据在 Google Cloud Vision API 中不可用

如何通过HTTP请求验证Google Cloud Vision