پروژه هوش مصنوعی - OCR

سلام

پیشنهاد میکنم این کد رو توی Google colab ران کنید چون نیاز دارید که یک مورد پیش نیاز رو دانلود کنید. البته کسایی که لینوکس و مکینتاش دارن نیازی به ران کردن کد تو Google colab ندارن.

دانلود پیش نیاز

چیزی که ما نیاز داریم، دانلود Pytesseract هستش که خیلی هم سادس:

. ویندوز: توی Google colab بنویسید:

!sudo apt install tesseract-ocr
!pip install pytesseract
دانلود پیش نیاز ها در Google colab
دانلود پیش نیاز ها در Google colab

. مکینتاش و لینوکس: توی ترمینال بنویسید:

sudo apt install tesseract-ocr

و سپس بنویسید:

pip install pytesseract

حالا میریم سر کار اصلیمون. یعنی بخش اصلی کد!!!

اول از همه نیاز داریم برای استفاده از بعضی دستورات چند تا کتابخونه رو صدا کنیم، پس:

import pytesseract
import shutil
import os
import random
try:
        from PIL import Image
except ImportError:
        import Image
توجه داشته باشید که این بخش خروجی نداره
توجه داشته باشید که این بخش خروجی نداره

بعد از اینکه این کد رو کامپایل کردید، نوبت اینه که عکس مورد نظرمون رو آپلود کنیم، پس:

from google.colab import files
uploaded = files.upload()
خروجی به این صورته
خروجی به این صورته
عکسی که من برای تست کدم انتخاب کردم
عکسی که من برای تست کدم انتخاب کردم

بعد از اینکه عکس مورد نظرتون رو آپلود کردید باید بوسیله یک متغیر، متن نوشته شده تو اون عکس رو ذخیره کنید ( باید متن درون عکس رو تو همون متغیر ذخیره کنید ). پس:

extractedInformation = pytesseract.image_to_string(Image.open('10.png'))

توجه کنید که اگه کد ها رو کپی کردید، باید اسم عکستون رو بجای اسم عکس من ( 10.png ) بزارید.

* توجه داشته باشید که اسم عکستون حتما باید عدد باشه ( مثل: 2 )، پس نباید نوشته باشه ( مثل: Image )

حالا وقتشه که مقداری ( متنی ) که تو متغیرمون ذخیره کردیم رو چاپ کنیم، پس:

print (extractedInformation)
تمام!!!
تمام!!!