Google Cloud Vision API PDF 文本提取
Posted
技术标签:
【中文标题】Google Cloud Vision API PDF 文本提取【英文标题】:Google Cloud Vision API PDF text extraction 【发布时间】:2019-02-05 03:46:01 【问题描述】:我正在尝试使用谷歌文档https://cloud.google.com/vision/docs/pdf 中提供的 python 代码从 pdf(图像转换为 pdf)中提取文本。 如文档中所述,我已经创建了服务帐户密钥并将其用于身份验证,并且我在我的 PC 中使用了 google SDK。代码超时并出现以下错误:
File "C:\*****\pdf_code.py", line 39, in async_detect_document
operation.result(timeout=180) File "C:\Python27\lib\site-packages\google\api_core\future\polling.py", line 120, in result
raise self._exception google.api_core.exceptions.GoogleAPICallError: None Error writing final output to: gs://******/output-1-to-1.json
任何帮助将不胜感激。
【问题讨论】:
【参考方案1】:我遇到了类似的错误,我正在使用服务帐户访问 Cloud vision api 并在我的本地使用服务帐户密钥
我通过授予相同的服务帐户写入存储桶的权限解决了上述错误 ->
导航到 console.cloud.google.com storage->browser --> 导航到要存储输出文件的存储桶 选择权限选项卡 --> 点击“添加成员”按钮 在“新成员”文本框中提及您的服务帐户——类似 "xyz-vision-api@your_project_name.iam.gserviceaccount.com" 选择存储管理员角色 保存您的错误应该得到解决
【讨论】:
【参考方案2】:上面写着:Error writing final output to: gs://******/output-1-to-1.json
...您可能需要在本地安装gcloud
和gsutil
;还要检查存储桶ACL
。
当gcloud
未登录或gsutil
不可用时,这不会写入存储桶。
【讨论】:
以上是关于Google Cloud Vision API PDF 文本提取的主要内容,如果未能解决你的问题,请参考以下文章
Google Cloud Vision API PDF 文本提取
如何提高google cloud vision api的处理速度?
Google Cloud Vision API“错误的图像数据”错误
PHP Google Cloud Vision API:注释立即淹没内存