Google hat die ursprünglich von
HP entwickelte OCR-Engine Tesseract unter einer Apache-2.0-Lizenz in die Open-Source-Community entlassen. Im gegenwärtigen Zustand ist die Software eine reine Texterkennungs-Engine ohne Benutzeroberfläche, der überdies einige Funktionen fehlen.
Google plant aber offenbar, das Projekt weiterzuentwickeln - darauf lässt eine Stellenanzeige schliessen, mit der Google Texterkennungsspezialisten sucht. In der aktuellen Version 1.0 lässt sich Tesseract von Sourceforge herunterladen. (IW)