一个让用户轻松进行 OCR、存档和搜索任何文档的Python库

OCR是主要的计算机视觉应用之一。我们经常发现自己拍摄文件的图像以发送给他人。现在,每个人都希望将这些材料变成适当类型的文档,而不是作为照片提供。在这种情况下使用 OcrPy。OcrPy 的主要目标是让用户使用强大的 Pipeline API 可以简单明了地进行 OCR、存档、索引和搜索任何文档。光学字符识别、光学字符识别是计算机视觉的一个重要应用。 我们经常发现自己的图片文件发送给其他人。 现在每个人都想要这些材料变成充分输入文档而不是给照片。 在这种情况下OcrPy使用。 OcrPy的主要目的是让用户简单和明显的OCR,存档,索引和搜索任何文件使用一个健壮的管道API。

OCRpy 是一个 PyPI 托管的纯 Python 库OCRpy是PyPI-hosted Python-only图书馆 。通过包装不同的 OCR 引擎,如 Tesseract OCR、Aws Textract、Google Cloud Vision 和 Azure 计算机视觉,ocrpy 实现了这一点。

它集成了各种云技术和其他开源库提供的各种用户界面,并为用户提供了一个简单、主要的界面。Pip 是建议的安装方法。Ocrpy 让用户可以选择抽象级别来对不同类型的文档进行 OCR。使用 Ocrpy 的最佳和最首选的方法是通过管道 API,这在此处进行了说明。

有两种方法可以使用 Pipeline API。第一种方法需要在 yaml 文件中定义管道的配置,加载它,然后运行管道,如下所示:。 通过包装等不同的OCR引擎超正方体OCR, Aws Textract,谷歌云愿景,和蔚蓝的计算机视觉,ocrpy实现这一点。 它集成了各种云计算提供的各种用户界面技术和其他开源库,为用户提供一个简单的主界面。 Pip是建议安装方法。 Ocrpy给用户一个选择在不同的抽象级别的OCR文档。 最好的和最使用Ocrpy的首选方法是通过管道API,这是说明。 有两种方法可以使用管道的API。 第一种方法需要定义管道的配置在yaml文件,加载,然后运行管道如下:

from ocrpy import TextOcrPipeline

ocr_pipeline = TextOcrPipeline.from_config("ocrpy_config.yaml")
ocr_pipeline.process()

或者,也可以通过直接实例化管道类来运行管道,如下所示:另外,还可以运行一个管道通过管道直接实例化类如下:

from ocrpy import TextOcrPipeline

pipeline = TextOcrPipeline(source_dir='s3://document_bucket/',
                           destination_dir="gs://processed_document_bucket/outputs/",
                           parser_backend='aws-textract',
                           credentials_config={"AWS": "path/to/aws-credentials.env/file",
                                        "GCP": "path/to/gcp-credentials.json/file"})
pipeline.process()

Ocrpy 的快速入门笔记本包含有关如何使用它的详细教程。本笔记本介绍了如何使用 Ocrpy 执行以下任务:Ocrpy的快速启动笔记本包含一个详细的教程如何使用它。 这个笔记本解释了如何使用Ocrpy执行以下任务:

  • 文件分类分类的文档
  • 布局解析布局分析
  • 表格提取表提取
  • 运行整个文本 OCR 管道 OCR管道运行整个文本
  • 将捕获的结果发​送到他们的首选存储发送他们的首选存储捕获的结果

发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章