GOCR
Deweloperzy | Jörga Schulenburga |
---|---|
Pierwsze wydanie | grudzień 2000 |
Wersja stabilna | 0,52 / 15 października 2018
|
Napisane w | C |
System operacyjny | Linux , Windows , OS/2 |
Typ | Optyczne rozpoznawanie znaków |
Licencja | Powszechna Licencja Publiczna GNU |
Strona internetowa |
|
GOCR (lub JOCR ) to darmowy program do optycznego rozpoznawania znaków , napisany początkowo przez Jörga Schulenburga. Może być używany do konwersji lub skanowania plików graficznych ( portable pixmap lub PCX ) do plików tekstowych .
Cechy
GOCR twierdzi, że może obsługiwać jednokolumnowe czcionki bezszeryfowe o wysokości 20–60 pikseli. Zgłasza problemy z czcionkami szeryfowymi, nakładającymi się znakami, tekstem pisanym odręcznie, niejednorodnymi czcionkami, zaszumionymi obrazami, dużymi kątami pochylenia i tekstem w jakimkolwiek innym alfabecie niż alfabet łaciński .
GOCR może również tłumaczyć kody kreskowe .
Interfejs użytkownika
GOCR może być używany jako samodzielna aplikacja wiersza poleceń lub jako zaplecze dla innych programów. Jest wyposażony w interfejs graficzny gocr.tcl . GOCR może być również używany jako silnik OCR w OCRFeeder .
Rozwój
Wersja 0.3.0 została wydana w grudniu 2000 r., 0.3.5 w lutym 2002 r., A 0.37 w sierpniu 2002 r.
Pomiędzy wersją 0.40 (marzec 2005) a 0.43 (grudzień 2006) silnik rozpoznawania był stopniowo zastępowany wersją wektorową.
Wersja 0.48 została wydana w sierpniu 2009 roku.
Wersja 0.49 została wydana we wrześniu 2010 roku.
Wersja 0.50 została wydana w marcu 2013 roku.
Wersja 0.51 została wydana w sierpniu 2017 roku.
Nomenklatura
Pierwotnie aplikacja nosiła nazwę GOCR, co oznacza GNU Optical Character Recognition (GNU Optical Character Recognition). Kiedy przyszedł czas na rejestrację projektu na SourceForge , nazwa GOCR była już zajęta, więc projekt został zarejestrowany jako JOCR (Jörg's Optical Character Recognition).
W wyniku tej sytuacji projekt i aplikacja znane są zarówno jako GOCR, jak i JOCR. Schulenburg przyznaje, że jest to problematyczne.
formaty
Akceptowalne formaty obrazu to:
- PNM
- PBM
- PGM
- PPM
- PCX (niektóre)
- TGA
Inne formaty są automatycznie konwertowane przy użyciu netpbm-progs, gzip i bzip2 za pomocą uniksowego potoku. Te typy obrazów obejmują:
- pnm.gz
- pnm.bz2
- PNG
- JPG
- SPRZECZKA
- GIF-y
- BMP
Linki zewnętrzne
- Strona główna GOCR
- GOCR na SourceForge (może być nieaktualny)