如何仅输出整个段落[Google Cloud Vision API,document_text_detection]

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何仅输出整个段落[Google Cloud Vision API,document_text_detection]相关的知识,希望对你有一定的参考价值。

我尝试使用Google Cloud Vision API的document_text_detection。它在日语中真的很好用,但是我有一个问题。响应包含整个段落和带有换行符的部分段落。我只需要整个段落。

这是回应。

Google keep の画像 テキスト化
画像文字認識で手書き文字をどこ
までテキスト化が出来るのかをテスト。
Google keep OCR機能がとれた
け使えるかを確認
この手書き文書を認献してiPhone
のGoogle keepでテキスト化して
Macで編集をするのにどれだけ
出来るかも確認する。

Google
keep
の画像
テキスト化
画像文字認識で手書き文字をどこ
までテキスト化が出来るのかをテスト
。
Google
keep
OCR機能がとれた
け使えるかを確認
この手書き文書を認献してiPhone
のGoogle
keepでテキスト化して
Macで編集をするのにどれだけ
出来るかも確認する
。

这是我的python代码。

import io
import os

os.environ["GOOGLE_APPLICATION_CREDENTIALS"]="credentials.json"
"""Detects text in the file."""
from google.cloud import vision
client = vision.ImageAnnotatorClient()
directory = 'resources/'
files = os.listdir(directory)

for i in files:
    with io.open(directory+i, 'rb') as image_file:
        content = image_file.read()

    image = vision.types.Image(content=content)

    response = client.document_text_detection(image=image)
    texts = response.text_annotations

    for text in texts:
        print('{}'.format(text.description))

我阅读了API参考(https://cloud.google.com/vision/docs/reference/rest/v1/AnnotateImageResponse#TextAnnotation),并提出了使用response.full_text_annotation代替response.text_annotations的想法。

image = vision.types.Image(content=content)
response = client.document_text_detection(image=image)
texts = response.full_text_annotation
print('{}'.format(text))

但是我收到一条错误消息。

File "/home/kazu/language/ocr.py", line 21, in <module> print('{}'.format(text))
NameError: name 'text' is not defined

您能给我任何信息或建议吗?

先谢谢您。

真诚,Kazu

答案

看起来像错字。您将变量命名为“文本”,但尝试使用变量“文本”。

以上是关于如何仅输出整个段落[Google Cloud Vision API,document_text_detection]的主要内容,如果未能解决你的问题,请参考以下文章

Google Cloud PubSub:如何仅读取最新记录

如何在 Google Cloud Platform 上查看 Dataproc 作业的输出文件

Python正则表达式仅根据正则表达式替换段落中的特定行而不是整个文件

如何使用 R 将 Google Cloud Datalab 输出保存到 BigQuery

VertexAI Pipeline:如何使用自定义 kfp 组件的输出作为 google_cloud_pipeline_components 的输入?

如何访问 Python google.cloud.storage 上传方法中的错误原因?