Tesseract.js to biblioteka javascript, która pobiera słowa w prawie każdym języku z obrazów.
Silnik Tesseract OCR był jednym z 3 najlepszych silników w teście dokładności UNLV 1995. W latach 1995–2006 wykonano niewiele pracy, ale jest to prawdopodobnie jeden z najdokładniejszych dostępnych silników OCR dostępnych na rynku. Kod źródłowy odczytuje obraz binarny, szary lub kolorowy i tekst wyjściowy. Wbudowany jest czytnik tiff, który odczytuje nieskompresowane obrazy TIFF, lub libtiff można dodać do odczytu skompresowanych obrazów. Istnieją pliki językowe dla wielu języków, nawet dla tekstu ustawionego we czcionkach Fraktur i blackletter.