Cara Menginstal Tesseract di Windows

Cara Menginstal Tesseract Di Windows



Tesseract adalah alat pengenalan teks sumber terbuka yang tersedia secara bebas yang juga dikenal sebagai OCR (Pengenalan karakter optik). Ini terutama digunakan untuk mengidentifikasi dan mengekstrak teks dari gambar. Ini akan membaca teks dari data gambar dan menulis output dalam file .txt baru. Tesseract juga bekerja di bawah Python, karena terutama digunakan untuk mengenali tulisan tangan dari gambar. Ini menggunakan model LSTR (Long short term memory). Tesseract bekerja di bawah lisensi Apache 2.0.

Kami akan menguraikan metode untuk menginstal Tesseract di Windows di blog ini.







Jadi, mari kita mulai!



Bagaimana cara menginstal Tesseract di Windows?

Tesseract adalah alat baris perintah yang digunakan untuk ekstraksi teks dari gambar. Untuk menginstal Tesseract di Windows, Anda harus mengikuti petunjuk yang diberikan di bawah ini.



Langkah 1: Unduh Penginstal Tesseract





Pertama, navigasikan ke tautan yang disediakan di bawah ini dan unduh penginstal Tesseract sesuai dengan spesifikasi sistem Anda:

https: // github.com / UB-Mannheim / tesseract / pekan



Langkah 2: Jalankan Penginstal Tesseract

Mengunjungi ' Unduhan ” tempat penginstal Tesseract diunduh. Untuk menginstal Tesseract di Windows, jalankan penginstal Tesseract dengan mengklik dua kali di atasnya:

Langkah 3: Pilih Bahasa

Banyak bahasa yang didukung oleh penginstal Tesseract. Untuk berinteraksi dengan UI Pemasang, pilih “ Bahasa inggris ” sebagai bahasa Anda dan klik “ Oke ”:

Langkah 4: Instal Tesseract

Setelah melakukannya, wizard pengaturan Tesseract OCR akan muncul di layar. Untuk memulai instalasi Tesseract, tekan tombol “ Lanjut ' tombol:

Untuk menerima “ Perjanjian lisensi ”, klik “ Saya setuju ' tombol:

Pilih “ Install untuk siapa saja yang menggunakan komputer ini ” dan tekan tombol “ Lanjut ' tombol:

Jika Anda ingin menambahkan data skrip atau menyertakan bahasa lain, tandai kotak centang masing-masing dan tekan tombol “ Lanjut ' tombol. Karena kami tidak menginginkan skrip atau bahasa data tambahan, kami akan melanjutkan dengan opsi yang dipilih secara default:

Pilih lokasi instalasi dan klik tombol “ Lanjut ' tombol:

Jika Anda tidak ingin membuat shortcut di menu Start, maka tandai tombol “ Jangan membuat jalan pintas ” centang kotak dan tekan tombol “ Install ' tombol:

Setelah itu, instalasi Tesseract akan dimulai. Tunggu hingga instalasi selesai dan tekan tombol “ Lanjut ' tombol:

Terakhir, klik tombol “ Menyelesaikan ' tombol:

Langkah 5: Tetapkan Variabel Lingkungan

Setelah instalasi, Anda perlu mengatur variabel lingkungan Tesseract. Untuk melakukannya, pertama-tama kunjungi direktori tempat Anda menginstal Tesseract dan salin jalur dari ' Alamat ' batang:

Lakukan pencarian untuk “ Variabel Lingkungan ' dalam ' Memulai 'menu dan buka' Edit variabel lingkungan sistem ”:

Di dalam pengaturan, navigasikan ke ' Canggih ” menu pengaturan dan klik pada “ Variabel Lingkungan ' tombol:

Memilih ' Jalur ”Variabel dari” Variabel Sistem ”, dan tekan tombol “ Sunting ' tombol:

Setelah itu ' Edit Variabel Lingkungan ” akan muncul di layar. Tekan ' Baru ” dan rekatkan jalur direktori instalasi Tesseract yang disalin di sini. Terakhir, klik tombol “ Oke ' tombol:

Langkah 6: Verifikasi Instalasi Tesseract

Untuk memverifikasi Instalasi Tesseract, buka Command Prompt Windows dengan mencari “ Prompt Perintah ' dalam ' Memulai ' Tidak bisa:

Lihat versi Tesseract menggunakan perintah yang disediakan:

> tesseract --Versi: kapan

Output yang diberikan di bawah ini menunjukkan bahwa kami telah berhasil menginstal versi Tesseract “ v5.2.0 ” pada Windows:

Mari kita lanjutkan untuk melihat cara menggunakan Tesseract di Windows.

Bagaimana Cara Menggunakan Tesseract di Windows?

Tesseract digunakan untuk membaca tulisan tangan atau mengekstrak teks dari gambar. Mari kita lihat cara kerjanya:

Langkah 1: Pilih Gambar

Pilih gambar dari mana Anda ingin mengekstrak teks. Seperti yang telah kita pilih “ 1.png ”:

Langkah 2: Ekstrak Teks Dari Gambar

Setelah CMD dibuka. Gunakan “ CD ” perintah untuk mengubah direktori tempat penyimpanan gambar. Kemudian jalankan “ tesseract ” perintah dan tentukan nama file gambar seperti yang telah kita tentukan “ 1.png ”. ' Teks ” parameter menunjukkan menunjukkan nama file output:

> CD C:\Users\anuma\OneDrive\Pictures\Saved Pictures
> tesseract 1 .png 'Teks'

Langkah 3: Verifikasi Ekstraksi Teks

Untuk memverifikasi ekstraksi teks, navigasikan direktori tempat file gambar berada. Anda dapat melihat bahwa file output “ Teks ” juga disimpan di sini. Klik dua kali pada file output untuk memeriksa apakah tesseract telah mengekstrak teks dari gambar atau tidak:

Anda dapat melihat bahwa kami telah berhasil mengekstrak teks menggunakan alat baris perintah Tesseract:

Kami telah mendemonstrasikan teknik untuk menginstal dan menggunakan Tesseract di Windows.

Kesimpulan

Untuk menginstal Tesseract di Windows, Anda harus mengunduh penginstal Tesseract. Untuk tujuan ini, ikuti sesi pertama artikel ini. Selanjutnya atur variabel lingkungan Path untuk menggunakan dan mengakses Tesseract dari Windows Command Prompt. Kemudian, pilih file gambar dan gunakan ' Tesseract ” perintah untuk mengenali dan mengekstrak teks dari gambar. Di sini, Anda telah belajar menginstal serta menggunakan ' Tesseract ” di jendela.