Ich bin auf der Seite von @metalposaunist Das Problem ist nicht, dass OCR nicht alles erkennt, das Problem ist, dass die Lieferanten keine XMLs in die PDFs einbetten, die alle Daten (maschinell mit 100%iger Korrektheit) lesbar enthalten. Wobei das PDF ja eigentlich auch schon wieder nur optischer Pfusch ist, der eigentlich keinen Sinn macht. Es würde theoretisch einfach nur eine XML Datei ausreichen. OCR selbst ist ein Problem, mit dem ein anderes Problem versucht wird zu lösen - eben dass keine nativen digitalen Daten vorliegen. Und das ist einfach nicht die Zukunft. OCR ist bei Rechnungen total ungeeignet, da es keine zuverlässigen Ergebnisse liefert. Und wenn ich mich auf ein System nicht zu 100% verlassen kann, bringt es mir nichts. Man setzt sich ja auch nicht in ein Auto, bei dem die Bremsen nur in 80% der Fälle funktionieren. Somit macht eine Weiterentwicklung von OCR keinen Sinn. Ich kenne ein paar Firmen, die ihre Lieferanten dazu zwingen, nur noch Rechnungen im ZUGFeRD Format zu schicken. Entweder die Lieferanten suchen sich eine Software, die das beherrscht, oder sie bekommen den Auftrag nicht. Punkt Fertig.
... Mehr anzeigen