Ich verstehe ehrlich gesagt den Lösungsansatz nicht so ganz. Wenn ich zwei hochgeladene Rechnungen mit derselben Rechnungsnummer, demselben Rechnungsdatum und demselben Rechnungsbetrag online habe, ist doch mit einer recht hohen Wahrscheinlichkeit davon auszugehen, dass es sich um eine Doublette handelt. Dafür muss ich doch keine Dateinamen, Dateigröße, Hash-Werte oder sonstwas prüfen. Ich habe das Gefühl, dass man über eine Prüfung von Rg.Nr., Rg.Datum und Rg.Betrag den überwiegenden Großteil aller Doubletten eliminieren kann - und das nicht im Sinne eines Voll-Automatismus, als vielmehr im Sinne einer Überprüfung, die dem Nutzer die Autonomie lässt, ein Dokument trotz einer Doublettenvermutung doch zuzulassen. Der IT-mäßige Aufwand wäre aus meiner Sicht sehr überschaubar. Möchte ich noch bessere Ergebnisse, verhält es sich wie mit der 80-20-Regel: Um die letzten 20% rauszukitzeln, muss ich erheblichen Aufwand hineinstecken (z.B. KI). Warum konzentriert man sich nicht auf das vermeintlich Wesentliche? Bin um jeden Hinweis dankbar, der mir erklärt, weshalb es immer nur um die eierlegende Wollmilchsau-Lösung geht.
... Mehr anzeigen