abbrechen
Suchergebnisse werden angezeigt für 
Stattdessen suchen nach 
Meintest du: 

Bessere OCR für moderne standard Belege

Offen
letzte Antwort am 08.07.2021 17:31:36 von metalposaunist
Dieser Beitrag ist geschlossen
larsboehnke
DATEV-Marktplatz Partner
Offline Online
784 Mal angesehen

Als Unternehmer möchte ich auch gute OCR Werte für mittlerweile marktübliche Rechnungen wie Facebook, Amazon oder Google, damit man nicht immer das Gefühl hat, wir sind noch im Jahr 2000 (und man deutlich schneller ist).

Ist ja nur eine Idee...

Ich beschäftige mich jetzt seit zehn Jahren mit digitalen FIBU Prozessen. Seit kurzem teile ich meine Gedanken dazu in meinem Podcast Podcast.
Feedback willkommen ✌️
Status: Offen
16 Kommentare
olafbietz
Meister
Offline Online
418 Mal angesehen

Die OCR sollte auf die massenhaft auftretenden Belege dieser Anbieter ausgelegt sein, keine Frage.

Das ganze ließe sich auch durch eine intelligente Software lösen:

oder indem man der Software händisch sagt, wo die betreffenden Informationen stehen, und die Software sich das merkt:

larsboehnke
DATEV-Marktplatz Partner
Offline Online
418 Mal angesehen

Klar, der Buchungsassistent wird auch die OCR-Erkennung verbessern. Es gibt ja Millionen an gelabelten Daten, die dafür aller verwendet werden können. Die Verbesserungen werden den Kunden vermutlich einfach noch nicht zur Verfügung gestellt, weil sie noch nicht fertig ist.

Und Belegdaten manuell auszulesen halte ich für keine gute Idee. Das sind ja nur Wünsche, die jetzt aufkommen, weil Kunden von der aktuellen Qualität frustriert sind und das entsprechend in solchen Wünschen formulieren. Ich würde hier eher erwarten, dass die Software insgesamt besser wird. Es ist ja nicht unsere Aufgabe als Kunden, die aktuellen Unzulänglichkeiten zu kompensieren.

olafbietz
Meister
Offline Online
418 Mal angesehen

Klar, der Buchungsassistent wird auch die OCR-Erkennung verbessern. Es gibt ja Millionen an gelabelten Daten, die dafür aller verwendet werden können. Die Verbesserungen werden den Kunden vermutlich einfach noch nicht zur Verfügung gestellt, weil sie noch nicht fertig ist.

Wenn ich DATEV richtig verstanden habe, wird der Buchungsassistent keinerlei Auswirkung auf die OCR haben! Das Problem mit Amazon-, Facebook- und Google-Belegen wird dadurch nicht gelöst.

Die "KI" schaut nur, wie die Belege nach der (ggf. erfolglosen) OCR weiter verarbeitet wurden und entwickelt daraus Buchungsvorschläge. Daher meine Kritik an DATEV: Es macht keinen Sinn ein tolles Haus auf ein rissiges Fundament zu stellen. Die KI wird schlecht, unvollständig oder nicht erkannte Belege automatisiert weiter verarbeiten. Die Qualität der Fibu sinkt. Oder es bedarf einer umfangreichen Nachbearbeitung.

Eine nahezu vollständige OCR wäre mir wichtiger, als das der Buchungsassistent Buchungsgewohnheiten der breiten Masse auf meine sehr speziellen Buchhaltungen anzuwenden versucht.

larsboehnke
DATEV-Marktplatz Partner
Offline Online
418 Mal angesehen

Richtig, technisch gesehen generiert der Buchungsassistent wohl nur Buchungsvorschläge. Trotzdem hat man Millionen Buchungssätze die in gelabelten Daten resultieren, also wird es da auch OCR Verbesserungen geben. Heißt vielleicht nur nicht Buchungsassistent. Die Basis ist dieselbe. Die OCR erkennt etwas, der Mandant oder das Steuerbüro korrigiert es, schon hat mal einen Beleg mit gelabelten Daten, die man dann nutzen kann um ein Machine Learning Modell für das entsprechende Feld zu implementieren. Ich denke, dass ist bisher noch nicht passiert, weil durch den Buchungsassistenten erst die notwendigen technischen Grundlagen geschaffen wurden, um überhaupt solche Machine Learning Modelle für die Belegauslesung zu entwickeln.

mkolberg
Meister
Offline Online
418 Mal angesehen

Die KI sollte auf "dem ersten Blick" vorab erkennen, daß es sich um einen Amazon, oder sonst einen "bekannten" Beleg handelt, um im 2. Schritt dann die Daten in einem für diesen Beleg optimiertem Scan- Modul zu extrahieren.

eine KI wäre auch binnen kürzester zeit in der Lage intelligent auf geänderte Belege dieses Anbieters zu reagieren.

larsboehnke
DATEV-Marktplatz Partner
Offline Online
418 Mal angesehen

Naja, ganz so funktioniert Machine Learning dann leider doch nicht. Die Technik ist hier ja noch sehr am Anfang und das ist alles auch alles andere als trivial. Das Ganze lässt sich leider auch nicht so einfach steuern, wie man vielleicht meint. Aber sollte da mit den Daten, die DATEV zur Verfügung stehen schon ein paar Verbesserungen hinbekommen und ich bin sicher, dass die DATEV da auch dran arbeitet.

xml
Fachmann
Offline Online
418 Mal angesehen

@ DATEV: Gibt es ein Info-Dok, in dem dokumentiert ist, auf welche Begriffe die OCR anschlägt?

Das würde das Verständnis für die OCR auf der Seite des Anwenders erhöhen und zu weniger Rätselraten führen.

hier ein Beispiel: In dieser Abschlagsrechnung steht statt Rechnungsnummer nur "Nummer", und schon läuft die OCR ins Leere.

394257_pastedImage_0.png

DATEV-Mitarbeiter
Silvija_Döbereiner
DATEV-Mitarbeiter
DATEV-Mitarbeiter
Offline Online
418 Mal angesehen

Hallo,

wir haben zum Buchungsassistent online folgende Infos:

DATEV Buchungsassistent online – Tipps zur Qualität und zum Aufbau der Belege  Info-Datenbank, Dok.-Nr. 1036438

DATEV Buchungsassistent online -  Info-Datenbank, Dok.-Nr. 1071472

Viele Grüße

Silvija Radicek

xml
Fachmann
Offline Online
418 Mal angesehen

Guten Morgen Frau Radicek,

Vielen Dank für das Dok.

Wissen Sie auch, welche Abkürzungen für "Rechnungsnummer" erkannt/akzeptiert werden.

Hintergrund:

Leider verwenden einige Lieferanten Abkürzungen für den Begriff "Rechnungsnummer".

z.B. (Beispiel einer großen Autovermietung):

Rech.Nr (wird nicht erkannt)

394451_pastedImage_1.png

Wenn ich die von der DATEV unterstützen Abkürzungen kennen würde, dann würde ich diese den Lieferanten mitteilen.

394363_pastedImage_0.png

olafbietz
Meister
Offline Online
418 Mal angesehen

Rech.Nr (wird nicht erkannt)

Wenn ich die von der DATEV unterstützen Abkürzungen kennen würde, dann würde ich diese den Lieferanten mitteilen.

Wobei ich der Meinung bin, dass DATEV sich auf den Markt und die Marktteilnehmer einstellen sollte und nicht umgekehrt.

eliansawatzki
Meister
Offline Online
302 Mal angesehen

Hallo Herr Bietz,

ich bin ganz Ihrer Meinung, dass die OCR an marktübliche Bezeichnungen bzw. Abkürzungen angepasst werden sollte.

Nicht auf Ihren Beitrag bezogen ist für mich die Bezeichnung „Rech.Nr“ jedoch nicht marktüblich. Das ist für mich eher ein Konglomerat orthographischer Fehler.

DATEV-Mitarbeiter
Silvija_Döbereiner
DATEV-Mitarbeiter
DATEV-Mitarbeiter
Offline Online
302 Mal angesehen

Hallo,

„Rech.Nr:“ ist ein Schlüsselbegriff zur Erkennung der Rechnungsnummer. Wenn es trotzdem nicht erkannt wird, liegt es sehr wahrscheinlich an der Qualität des TIFFs bzw. PDFs. Vielleicht können Sie daran etwas "rumspielen" (s. Kapitel 2.1 in Info-Datenbank, Dok.-Nr. 1036438 ).

Sollte es dann noch immer nicht erkannt werden, können Sie sich gerne per SK bei uns melden und wir schauen uns den Originalbeleg an

Viele Grüße

Silvija Radicek

Gelöschter Nutzer
Offline Online
302 Mal angesehen

Warum gibt es nicht eine editierbare Suchbegriffsliste für den Anwender, damit er auf seine persönliche Bedürfnisse reagieren kann?

So kann man z. B. für den Suchbegriff Rechnungsnummer sämtliche verwendete Varianten hinterlegen, die einfach der Reihe nach abgearbeitet werden. Dabei ist die Reihenfolge bei den individuellen Suchbegriffen durch den Anwender zu beeinflussen.

  1. Rechnungsnummer (Standard)
  2. Rechnungsnr
  3. RgNr
  4. RechNr
  5. [...]

Damit hätte man einen flexiblen und universellen Suchalgorithmus, der nichts mehr an Wünschen offen läßt.

So herum wird ein Schuh draus. Alles andere ist irgendwie zufallsgesteuert.

Gruß A. Martens

Gelöschter Nutzer
Offline Online
229 Mal angesehen

Und dann wundert man sich warum die Bankbuchung nicht zugeordnet werden kann

 

tu_heggi_0-1625745810819.png

 

Gelöschter Nutzer
Offline Online
223 Mal angesehen

Absolut kein Einzelfall

 

tu_heggi_0-1625746180771.png

 

metalposaunist
Unerreicht
Offline Online
203 Mal angesehen

@Gelöschter Nutzer schrieb:

Warum gibt es nicht eine editierbare Suchbegriffsliste für den Anwender, damit er auf seine persönliche Bedürfnisse reagieren kann?


So? Belegdaten zusätzlich manuell per OCR auslesen