OCR是主要的计算机视觉应用之一。我们经常发现自己拍摄文件的图像以发送给他人。现在,每个人都希望将这些材料变成适当类型的文档,而不是作为照片提供。在这种情况下使用 OcrPy。OcrPy 的主要目标是让用户使用强大的 Pipeline API 可以简单明了地进行 OCR、存档、索引和搜索任何文档。光学字符识别、光学字符识别是计算机视觉的一个重要应用。 我们经常发现自己的图片文件发送给其他人。 现在每个人都想要这些材料变成充分输入文档而不是给照片。 在这种情况下OcrPy使用。 OcrPy的主要目的是让用户简单和明显的OCR,存档,索引和搜索任何文件使用一个健壮的管道API。
OCRpy 是一个 PyPI 托管的纯 Python 库OCRpy是PyPI-hosted Python-only图书馆 。通过包装不同的 OCR 引擎,如 Tesseract OCR、Aws Textract、Google Cloud Vision 和 Azure 计算机视觉,ocrpy 实现了这一点。
它集成了各种云技术和其他开源库提供的各种用户界面,并为用户提供了一个简单、主要的界面。Pip 是建议的安装方法。Ocrpy 让用户可以选择抽象级别来对不同类型的文档进行 OCR。使用 Ocrpy 的最佳和最首选的方法是通过管道 API,这在此处进行了说明。
有两种方法可以使用 Pipeline API。第一种方法需要在 yaml 文件中定义管道的配置,加载它,然后运行管道,如下所示:。 通过包装等不同的OCR引擎超正方体OCR, Aws Textract,谷歌云愿景,和蔚蓝的计算机视觉,ocrpy实现这一点。 它集成了各种云计算提供的各种用户界面技术和其他开源库,为用户提供一个简单的主界面。 Pip是建议安装方法。 Ocrpy给用户一个选择在不同的抽象级别的OCR文档。 最好的和最使用Ocrpy的首选方法是通过管道API,这是说明。 有两种方法可以使用管道的API。 第一种方法需要定义管道的配置在yaml文件,加载,然后运行管道如下:
from ocrpy import TextOcrPipeline
ocr_pipeline = TextOcrPipeline.from_config("ocrpy_config.yaml")
ocr_pipeline.process()
或者,也可以通过直接实例化管道类来运行管道,如下所示:另外,还可以运行一个管道通过管道直接实例化类如下:
from ocrpy import TextOcrPipeline
pipeline = TextOcrPipeline(source_dir='s3://document_bucket/',
destination_dir="gs://processed_document_bucket/outputs/",
parser_backend='aws-textract',
credentials_config={"AWS": "path/to/aws-credentials.env/file",
"GCP": "path/to/gcp-credentials.json/file"})
pipeline.process()
Ocrpy 的快速入门笔记本包含有关如何使用它的详细教程。本笔记本介绍了如何使用 Ocrpy 执行以下任务:Ocrpy的快速启动笔记本包含一个详细的教程如何使用它。 这个笔记本解释了如何使用Ocrpy执行以下任务:
留言与评论(共有 0 条评论) “” |