GOCR

GOCR
Deweloperzy Jörga Schulenburga
Pierwsze wydanie grudzień 2000 ; 22 lata temu ( 2000-12 )
Wersja stabilna
0,52 / 15 października 2018 ; 4 lata temu ( 2018-10-15 )
Napisane w C
System operacyjny Linux , Windows , OS/2
Typ Optyczne rozpoznawanie znaków
Licencja Powszechna Licencja Publiczna GNU
Strona internetowa www-e .uni-magdeburg .de /jschulen /ocr / jocr .sourceforge .net (może być nieaktualne)

GOCR (lub JOCR ) to darmowy program do optycznego rozpoznawania znaków , napisany początkowo przez Jörga Schulenburga. Może być używany do konwersji lub skanowania plików graficznych ( portable pixmap lub PCX ) do plików tekstowych .

Cechy

GOCR twierdzi, że może obsługiwać jednokolumnowe czcionki bezszeryfowe o wysokości 20–60 pikseli. Zgłasza problemy z czcionkami szeryfowymi, nakładającymi się znakami, tekstem pisanym odręcznie, niejednorodnymi czcionkami, zaszumionymi obrazami, dużymi kątami pochylenia i tekstem w jakimkolwiek innym alfabecie niż alfabet łaciński .

GOCR może również tłumaczyć kody kreskowe .

Interfejs użytkownika

GOCR może być używany jako samodzielna aplikacja wiersza poleceń lub jako zaplecze dla innych programów. Jest wyposażony w interfejs graficzny gocr.tcl . GOCR może być również używany jako silnik OCR w OCRFeeder .

Rozwój

Wersja 0.3.0 została wydana w grudniu 2000 r., 0.3.5 w lutym 2002 r., A 0.37 w sierpniu 2002 r.

Pomiędzy wersją 0.40 (marzec 2005) a 0.43 (grudzień 2006) silnik rozpoznawania był stopniowo zastępowany wersją wektorową.

Wersja 0.48 została wydana w sierpniu 2009 roku.

Wersja 0.49 została wydana we wrześniu 2010 roku.

Wersja 0.50 została wydana w marcu 2013 roku.

Wersja 0.51 została wydana w sierpniu 2017 roku.

Nomenklatura

Pierwotnie aplikacja nosiła nazwę GOCR, co oznacza GNU Optical Character Recognition (GNU Optical Character Recognition). Kiedy przyszedł czas na rejestrację projektu na SourceForge , nazwa GOCR była już zajęta, więc projekt został zarejestrowany jako JOCR (Jörg's Optical Character Recognition).

W wyniku tej sytuacji projekt i aplikacja znane są zarówno jako GOCR, jak i JOCR. Schulenburg przyznaje, że jest to problematyczne.

formaty

Akceptowalne formaty obrazu to:

  • PNM
  • PBM
  • PGM
  • PPM
  • PCX (niektóre)
  • TGA

Inne formaty są automatycznie konwertowane przy użyciu netpbm-progs, gzip i bzip2 za pomocą uniksowego potoku. Te typy obrazów obejmują:

  • pnm.gz
  • pnm.bz2
  • PNG
  • JPG
  • SPRZECZKA
  • GIF-y
  • BMP

Linki zewnętrzne