Es muss doch so laufen (oder was sehe ich falsch): Der Mandat (oder eben der StB, wenn der Mandant damit bereits "überfordert" ist) legt einen Dokumentenstapel auf den Scanner und dann läuft eine Software drüber, die die Dokumente trennt und dabei in Eingangs- und Ausgangsrechnungen und sonstige Dokumente (letztere am besten auch klassifiziert) unterteilt. Dazu müssen nur die Angaben auf den Dokumenten ausgewertet werde Problematisch wird es erst, wenn Unterteilungen benötigt werden, die den Dokumenten nicht zu entnehmen sind wie z.B. Kostenstellen oder die Unterteilung in Bank und Kasse. Deine Ausgangsrechnungen sind ja gleich aufgebaut, da könntest Du mit 3D-Code sozusagen dem Programm die Daten direkt mitgeben oder auch per Schnittstelle an Datev die Buchungssätze der Ausgangsrechung übergeben, was Standard seins sollte. Genau die Angaben auf den Dokumenten der Eingangsrechnungen müssen dieser Software beigebracht werden, die diese Dokumente ausmachen. Diese Software muss selbst lernen. Es kommt also auf die Mustererkennung an; dazu noch unterschiedliche Eingangsrechnungen unterschiedlicher Lieferanten, welche jeweils anders aufgebaut sind. Das Problem bei den Angaben auf den Dokumenten ist die Heterogenität. Das was bei einem menschlichen Sachbearbeiter im Kopf abläuft (Aha, die Rechnung von Meyer hat ein neues Layout bekommen, die haben jetzt unsere Kundenummer an anderer Stelle) ist in einem Programm mit KI, oder was auch immer, nicht immer nachvollziehbar. Man benötigt eine sehr große Datenbasis, welche dem System bereitgestellt wird und man muss auch immer Stichproben machen und von Menschen kontrollieren lassen ob diese Dokumente korrekt erkannt werden. Ich habe beruflich mit diesem Erkennen von Dokumenten per Software, Zuordnung und Verarbeitung viel zu tun. Aktuell betreiben wir hier in Deutschland Digialisierung im ursprünglichen Sinne von "to digitize: in digitale Form bringen." Das sagt noch gar nichts über die Verarbeitung dieser digitalisierten Dokumente aus. Korrekterweise müssten auch die Abläufe bei elektronischer Verarbeitung neu gedacht und designt werden. Diese Transformation stellt sich komplexer dar, als das man es hier weiter diskutieren könnte. Kurz angeschnitten: Es wird auf formatierte Datenpakete, ähnlich wie XML, hinauslaufen, die ein "Papierdokument" ergänzen.
... Mehr anzeigen