一个让用户轻松进行 OCR、存档和搜索任何文档的Python库--粉丝服务平台-粉丝头条-fensifuwu.com

一个让用户轻松进行 OCR、存档和搜索任何文档的Python库

科技 08-24 来源：算法的秘密

OCR是主要的计算机视觉应用之一。我们经常发现自己拍摄文件的图像以发送给他人。现在，每个人都希望将这些材料变成适当类型的文档，而不是作为照片提供。在这种情况下使用 OcrPy。OcrPy 的主要目标是让用户使用强大的 Pipeline API 可以简单明了地进行 OCR、存档、索引和搜索任何文档。光学字符识别、光学字符识别是计算机视觉的一个重要应用。我们经常发现自己的图片文件发送给其他人。现在每个人都想要这些材料变成充分输入文档而不是给照片。在这种情况下OcrPy使用。 OcrPy的主要目的是让用户简单和明显的OCR,存档,索引和搜索任何文件使用一个健壮的管道API。

OCRpy 是一个 PyPI 托管的纯 Python 库OCRpy是PyPI-hosted Python-only图书馆。通过包装不同的 OCR 引擎，如 Tesseract OCR、Aws Textract、Google Cloud Vision 和 Azure 计算机视觉，ocrpy 实现了这一点。

它集成了各种云技术和其他开源库提供的各种用户界面，并为用户提供了一个简单、主要的界面。Pip 是建议的安装方法。Ocrpy 让用户可以选择抽象级别来对不同类型的文档进行 OCR。使用 Ocrpy 的最佳和最首选的方法是通过管道 API，这在此处进行了说明。

有两种方法可以使用 Pipeline API。第一种方法需要在 yaml 文件中定义管道的配置，加载它，然后运行管道，如下所示：。通过包装等不同的OCR引擎超正方体OCR, Aws Textract,谷歌云愿景,和蔚蓝的计算机视觉,ocrpy实现这一点。它集成了各种云计算提供的各种用户界面技术和其他开源库,为用户提供一个简单的主界面。 Pip是建议安装方法。 Ocrpy给用户一个选择在不同的抽象级别的OCR文档。最好的和最使用Ocrpy的首选方法是通过管道API,这是说明。有两种方法可以使用管道的API。第一种方法需要定义管道的配置在yaml文件,加载,然后运行管道如下:

from ocrpy import TextOcrPipeline

ocr_pipeline = TextOcrPipeline.from_config("ocrpy_config.yaml")
ocr_pipeline.process()

或者，也可以通过直接实例化管道类来运行管道，如下所示：另外,还可以运行一个管道通过管道直接实例化类如下:

from ocrpy import TextOcrPipeline

pipeline = TextOcrPipeline(source_dir='s3://document_bucket/',
                           destination_dir="gs://processed_document_bucket/outputs/",
                           parser_backend='aws-textract',
                           credentials_config={"AWS": "path/to/aws-credentials.env/file",
                                        "GCP": "path/to/gcp-credentials.json/file"})
pipeline.process()

Ocrpy 的快速入门笔记本包含有关如何使用它的详细教程。本笔记本介绍了如何使用 Ocrpy 执行以下任务：Ocrpy的快速启动笔记本包含一个详细的教程如何使用它。这个笔记本解释了如何使用Ocrpy执行以下任务: