Google Cloud Vision API PDF 文本提取

Posted 2023-04-17

技术标签:

【中文标题】Google Cloud Vision API PDF 文本提取【英文标题】：Google Cloud Vision API PDF text extraction 【发布时间】：2019-02-05 03:46:01 【问题描述】：

我正在尝试使用谷歌文档https://cloud.google.com/vision/docs/pdf 中提供的 python 代码从 pdf（图像转换为 pdf）中提取文本。如文档中所述，我已经创建了服务帐户密钥并将其用于身份验证，并且我在我的 PC 中使用了 google SDK。代码超时并出现以下错误：

File "C:\*****\pdf_code.py", line 39, in async_detect_document
operation.result(timeout=180)   File "C:\Python27\lib\site-packages\google\api_core\future\polling.py", line 120, in result
raise self._exception google.api_core.exceptions.GoogleAPICallError: None Error writing final output to: gs://******/output-1-to-1.json

任何帮助将不胜感激。

【问题讨论】：

【参考方案1】：

我遇到了类似的错误，我正在使用服务帐户访问 Cloud vision api 并在我的本地使用服务帐户密钥

我通过授予相同的服务帐户写入存储桶的权限解决了上述错误 ->

导航到 console.cloud.google.com storage->browser --> 导航到要存储输出文件的存储桶选择权限选项卡 --> 点击“添加成员”按钮在“新成员”文本框中提及您的服务帐户——类似 "xyz-vision-api@your_project_name.iam.gserviceaccount.com" 选择存储管理员角色保存

您的错误应该得到解决

【讨论】：

【参考方案2】：

上面写着：Error writing final output to: gs://******/output-1-to-1.json

...您可能需要在本地安装gcloud 和gsutil；还要检查存储桶ACL。

当gcloud 未登录或gsutil 不可用时，这不会写入存储桶。

【讨论】：

以上是关于Google Cloud Vision API PDF 文本提取的主要内容，如果未能解决你的问题，请参考以下文章

Google Cloud Vision API PDF 文本提取

如何提高google cloud vision api的处理速度？

Google Cloud Vision API“错误的图像数据”错误

PHP Google Cloud Vision API：注释立即淹没内存

应用程序凭据在 Google Cloud Vision API 中不可用

如何通过HTTP请求验证Google Cloud Vision