\

PythonでOCRを利用する方法には様々な手法が存在しますが、今回は特にPyocreasyOCRの使い方について紹介します。

Pyocr

PyocrはGoogleが開発したOCRエンジンを使用してOCRを行うライブラリです。文章として読み取ることに適しています。

インストール

!pip install pyocr
!apt install tesseract-ocr libtesseract-dev tesseract-ocr-jpn

使用例

from PIL import Image
import pyocr
import cv2
from google.colab.patches import cv2_imshow

# pyocrが使えることを確認する
tools = pyocr.get_available_tools()
# tesseractのみダウンロードしたため0番目を指定
tool = tools[0]
print(tool.get_name())  # Tesseract (sh)と出力されればOK

easyOCR

easyOCRは80以上の言語をサポートし、OCRをすぐに使用できます。画像内の単語を読み取ることに適しています。

インストール

!pip install easyocr

使用例

import easyocr
import cv2
from google.colab.patches import cv2_imshow

reader = easyocr.Reader(['ja','en'])  # 文字の選択一回だけでいい
path = "your/path"

以上がPyocreasyOCRの基本的な使い方となります。使用する状況によって使い分けることでより良い結果を得られます。

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です