如何仅输出整个段落[Google Cloud Vision API,document_text_detection]
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何仅输出整个段落[Google Cloud Vision API,document_text_detection]相关的知识,希望对你有一定的参考价值。
我尝试使用Google Cloud Vision API的document_text_detection
。它在日语中真的很好用,但是我有一个问题。响应包含整个段落和带有换行符的部分段落。我只需要整个段落。
这是回应。
Google keep の画像 テキスト化
画像文字認識で手書き文字をどこ
までテキスト化が出来るのかをテスト。
Google keep OCR機能がとれた
け使えるかを確認
この手書き文書を認献してiPhone
のGoogle keepでテキスト化して
Macで編集をするのにどれだけ
出来るかも確認する。
Google
keep
の画像
テキスト化
画像文字認識で手書き文字をどこ
までテキスト化が出来るのかをテスト
。
Google
keep
OCR機能がとれた
け使えるかを確認
この手書き文書を認献してiPhone
のGoogle
keepでテキスト化して
Macで編集をするのにどれだけ
出来るかも確認する
。
这是我的python代码。
import io
import os
os.environ["GOOGLE_APPLICATION_CREDENTIALS"]="credentials.json"
"""Detects text in the file."""
from google.cloud import vision
client = vision.ImageAnnotatorClient()
directory = 'resources/'
files = os.listdir(directory)
for i in files:
with io.open(directory+i, 'rb') as image_file:
content = image_file.read()
image = vision.types.Image(content=content)
response = client.document_text_detection(image=image)
texts = response.text_annotations
for text in texts:
print('{}'.format(text.description))
我阅读了API参考(https://cloud.google.com/vision/docs/reference/rest/v1/AnnotateImageResponse#TextAnnotation),并提出了使用response.full_text_annotation
代替response.text_annotations
的想法。
image = vision.types.Image(content=content)
response = client.document_text_detection(image=image)
texts = response.full_text_annotation
print('{}'.format(text))
但是我收到一条错误消息。
File "/home/kazu/language/ocr.py", line 21, in <module> print('{}'.format(text))
NameError: name 'text' is not defined
您能给我任何信息或建议吗?
先谢谢您。
真诚,Kazu
看起来像错字。您将变量命名为“文本”,但尝试使用变量“文本”。
以上是关于如何仅输出整个段落[Google Cloud Vision API,document_text_detection]的主要内容,如果未能解决你的问题,请参考以下文章
如何在 Google Cloud Platform 上查看 Dataproc 作业的输出文件
Python正则表达式仅根据正则表达式替换段落中的特定行而不是整个文件
如何使用 R 将 Google Cloud Datalab 输出保存到 BigQuery
VertexAI Pipeline:如何使用自定义 kfp 组件的输出作为 google_cloud_pipeline_components 的输入?