Tesseract OCR
Tesseract OCR | استخراج النصوص من الصور
Tesseract OCR⚓︎
استخراج النصوص العربية وغير العربية من الصور، وتحويلها نصوص مكتوبة، يمكن التعامل معها من خلال أي محرر نصوص عادي.
باستخدام تطبيق Tesseract OCR بتقنية Optical Character Recognition، التطبيق مفتوح المصدر ومجاني ويقدم الدعم لـ 100 لغة، وفي المقدمة اللغة العربية واللغة الإنجليزية.
#more
About Tesseract OCR - تعريف بالأداة⚓︎
install - التنصيب⚓︎
- Fedora
pre-installed on Fedora 36
sudo dnf install tesseract
- Ubuntu
sudo apt install tesseract-ocr
- Arch
sudo pacman -Sy
sudo pacman -S tesseract-data-eng
Arabic Support - دعم اللغة العربية⚓︎
- Fedora
sudo dnf install tesseract-langpack-ara
- Ubuntu
sudo apt install tesseract-ocr-ara
- Arch
sudo pacman -S tesseract-data-ara
Usage - الاستخدام⚓︎
- Arabic only - اللغة العربية فقط
tesseract -l ara image.png text
- English only - اللغة الإنجليزية فقط
tesseract -l eng image.png text
- Arabic and English - العربية والإنجليزية معًا
tesseract -l ara+eng image.png text
More Examples - مزيد من الأمثلة: here - هنا