Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Tesseract Version #139

Open
Angreifer2 opened this issue Dec 26, 2015 · 6 comments
Open

Tesseract Version #139

Angreifer2 opened this issue Dec 26, 2015 · 6 comments
Milestone

Comments

@Angreifer2
Copy link
Contributor

Hi,

nachdem Google Code eingestellt wurde ist Tesseract auf Github umgezogen. Seit der Version 3.02 welche - soweit ich das feststellen kann von euch verwendet wird - erschienen einige neue Versionen.
Leider gibt es für Windows keine offiziellen Builds. Dennoch habe ich mit dem hier:
http://domasofan.spdns.eu/tesseract/tesseract-core-20150916.exe
deutlich bessere Ergebnisse was die Texterkennung angeht. Bitte überlegt euch mal ob ihr da ggf. mal eine neue Version veröffentlicht wollt.

@kvn-stgl
Copy link
Collaborator

Kann ich nur bestätigen. Auch bei uns wird eine neue Tesseract Version eingesetzt, da diese teilweise eine erheblich bessere Texterkennung mit sich bringt ;)

@chrishensel
Copy link
Contributor

Von mir aus gerne. Müsste aber mit @Flozi95 abgeklärt werden, er hat extra für das Projekt eine Erkennungsdatei trainiert.

Außerdem würde ich das nicht mehr im Git einchecken, sondern entweder auf eine Datei verweisen oder als ZIP auf unserem Server ablegen.

@Flozi95
Copy link
Contributor

Flozi95 commented Dec 27, 2015

Also seitens mir spricht da nix dagegen. Meine trainierte Datei ist mit der neuen Version kompatibel. Man müsste aber die oben verwiesene Version verwenden. (Es gibt andere Builds die erzeugen Messageboxes.)
Einchecken würde ich die Binaries nicht. Nur noch meine Sprachdatei. Lieber dann im Zuge von CI da ein "Package" bauen?

@Angreifer2
Copy link
Contributor Author

Kann man vlt das hier verwenden:
https://github.com/charlesw/tesseract

@kvn-stgl
Copy link
Collaborator

Jaein. Im Grunde bringt dies keine Vorteile, da die Bibliothek nur ein Wrapper für die "libtesseract304.dll" ist. Ein einfaches installieren einer neuen Tesseract-Version und das setzten des Pfades in den Einstellungen hat den gleichen Effekt. (Und du kannst in Zukunft schneller zu neueren Versionen wechseln ;) )

@Angreifer2
Copy link
Contributor Author

Ich hab nur ein bisschen das Problem, dass ich die Tesseract Versionen unter https://github.com/tesseract-ocr/tesseract/wiki/Downloads alle recht aufgebläht sind und ich persönlich lieber eine "All-In-One" Lösung hätte.
Verstehst du? 😃

Was ich so sehe ruft die Bibliothek die Funktionen direkt auf. Hat das Einfluss auf die Performance und auf andere Sachen? Könnte mir vorstellen, dass hierdurch der ein oder andere Schritt (Das "umständliche" Aufrufen der exe) entfallen würde.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

4 participants