PythonでOCRを利用する方法には様々な手法が存在しますが、今回は特にPyocr
とeasyOCR
の使い方について紹介します。
Pyocr
Pyocr
はGoogleが開発したOCRエンジンを使用してOCRを行うライブラリです。文章として読み取ることに適しています。
インストール
!pip install pyocr
!apt install tesseract-ocr libtesseract-dev tesseract-ocr-jpn
使用例
from PIL import Image
import pyocr
import cv2
from google.colab.patches import cv2_imshow
# pyocrが使えることを確認する
tools = pyocr.get_available_tools()
# tesseractのみダウンロードしたため0番目を指定
tool = tools[0]
print(tool.get_name()) # Tesseract (sh)と出力されればOK
easyOCR
easyOCR
は80以上の言語をサポートし、OCRをすぐに使用できます。画像内の単語を読み取ることに適しています。
インストール
!pip install easyocr
使用例
import easyocr
import cv2
from google.colab.patches import cv2_imshow
reader = easyocr.Reader(['ja','en']) # 文字の選択一回だけでいい
path = "your/path"
以上がPyocr
とeasyOCR
の基本的な使い方となります。使用する状況によって使い分けることでより良い結果を得られます。