OpenOffice i OCRImport

OpenOffice i OCRImport

przez -
5 268
OpenOffice

Tesseract to wykupiony od HP oraz uwolniony przez Google, pierwszy silnik skanera OCR, który działa. Na jego podstawie rozwijany jest OCRopus, analizator dokumentów, wykorzystywany m.in przez AbiWorda. Wyzwanie jakim była jego integracja z Go-OO, podjął się pewien francuski student w ramach tegorocznego Google Summer of Code.

Choć praca nad projektem nie została jeszcze zakończona, Jonathan Winandy już opublikował wideo prezentujące postępy, oraz sposób działania dodatku.

Jak widać do końca bliska droga. Jonathan wymienia jeszcze 3 rzeczy, które musi zrobić przed wydaniem oficjalnej wersji: poprawić Interfejs użytkownika, stworzyć paczkę dla użytkownika końcowego oraz w ogóle stworzyć paczkę dla Windows.

Jasna rzecz, nie mógłbym nie wspomnieć o polskiej odnodze silnika tesseract, projekcie tesseract-polish, którego celem jest poprawa jakości w odczytywaniu polskich znaków narodowych. Jeśli masz za dużo czasu i zależy Ci na dobrym skanerze, ten projekt jest właśnie dla Ciebie!

Źródło: How OcrImport is going?