Die Volltextrecherche der Dokumentenablage gibt es ja nun seit geraumer Zeit. Ich finde in - mit OCR-Erkennung - gescannten pdf-Dateien selten etwas. Kurioses Beispiel:
Gescannter Gewerbesteuerbescheid. Wie man auf dem Screenshot sieht, hat die OCR-Erkennung nicht perfekt geklappt, aber das Wort "Erhebungszeitra" wurde erkannt.
Wenn ich nun in der Dokumentenablage über die Volltextrecherche nach diesem Wort suche, wird mir die Datei nur angezeigt, wenn im Suchfeld steht:
"erhebung" oder
"erhebungszeit"
nicht jedoch, wenn mehr oder weniger Buchstaben des Wortes eingegeben werden:
Dass die OCR-Erkennung beim Scan dieses Dokuments nicht gut war, ist mir klar. Aber warum erkennt die DATEV Dokumentenablage nur die beiden Eingaben und nicht auch andere Wortbestandteile?
Wenn ich nach Wortbestandteilen im Adobe Reader suche, werden diese gefunden.
Hallo Community,
in der Dokumentenablage gibt es keine OCR-Erkennung. PDF-Dokumente werden bei der Ablage von einen iFilter gescannt und die Daten in eine Volltextdatenbank geschrieben. Diese Suchergebnisse können über die Schnellsuche gefunden werden.
Auch wenn Dokumente mit anderen Programmen OCR erkannt werden, wirkt sich dies nicht auf die Volltexterkennung der Dokumentenablage aus.
Am besten Sie melden sich im Programm-Service, damit wir uns dies ansehen können.
Viele Grüße aus Nürnberg
Christian Seidel
DATEV eG, Service Dokumentenmanagement
Hallo Herr Seidel,
danke für Ihre Antwort.
Die entscheidende Frage ist: was liest der iFilter bei einem pdf-File aus? Etwa nicht die OCR-Daten, die beim Scanvorgang dem Dokument angehängt wurden? Wie kommen dann aber die dargestellten Treffer zustande?
Viele Grüße
Tobias Maaß
Hallo,
bitte melden Sie sich bei den Kollegen im DMS Programmservice. Ich vermute der Sachverhalt lässt sich via Telefon und Fernbetreuung besser klären.