71
Tesseract.js adalah perpustakaan javascript yang mendapat kata-kata dalam hampir mana-mana bahasa daripada imej.Enjin Tesseract OCR adalah salah satu daripada 3 enjin teratas dalam ujian Ketepatan UNLV 1995.Antara 1995 dan 2006 ia tidak banyak kerja yang dilakukan, tetapi mungkin salah satu daripada enjin open source OCR yang paling tepat.Kod sumber akan membaca teks dan teks output binari, kelabu atau warna.Pembaca tiff dibina dalam yang akan membaca imej TIFF yang tidak dikompresi, atau libtiff boleh ditambah untuk membaca imej dimampatkan.Terdapat fail bahasa untuk banyak bahasa, walaupun untuk teks yang ditetapkan dalam bentuk huruf fraktur dan blackletter ....