Kennt jemand eine gute freeware die PDF in Excel umwandelt?
Ich habe schlicht keine Lust hunderte Käufe und Verkäufe von Aktien zu tippen /tippen zu lassen.
Scannen Texterkennung automatisch konvertiert. Formeln drauf fertig. Wäre eher mein Weg.
Titel durch @Dirk_Jendritzki angepasst
Gelöst! Gehe zu Lösung.
Mit Office365 soll es wohl gehen. Aber Freeware außerhalb von Onlineanwendungen kann das meines Wissens nicht.
Außer man versucht es mit Uipath Studio abzubilden. Das ist aber nicht ganz einfach, aber als Community Edition kostenlos erhält.
Das Problem ist grundsätzlich das bei den ganzen kostenlosen Varianten entweder die Struktur nicht sauber erhalten bleibt oder ein Upload im Internet durchzuführen ist.
Mit ACL ist es theoretisch machbar, ist aber wieder nicht kostenlos.
Mit PDF24 können per OCR auslesbare PDF erstellt werden. Dadurch könnte sicherlich per kopieren und einfügen in eine Excel Datei, was brauchbares entstehen.
@jjunker schrieb:Kennt jemand eine gute freeware die PDF in Excel umwandelt?
Wenn du @Gelöschter Nutzer ganz ganz nett bittest. 🙈😭
@Gelöschter Nutzer : BITTE. Sonst muss ich morgen tatsächlich viel zu viele Zeilen tippen, oder einen finden der es tippt. 🤔
Der hier schon häufiger genannte PDF-XChange Editor Plus von Tracker Software schafft ganz ordentliche Ergebnisse.
Die Testversion kann nicht so viele Seiten, die Vollversion für einenUser mit 3 Jahren Support kostet 67,60 EUR.
Das Programm kann darüber hinaus noch eine ganze Menge mehr.
Hallo,
heute morgen in einem Slack-Channel erwähnt:
https://tabula.technology/
Vielleicht passt es.
"Tabula only works on text-based PDFs, not scanned documents"
(... also keine image-based PDFs ...)
nach meiner Erfahrung gibt es kein Patentrezept, um Text oder Tabellen 'unfallfrei' aus PDFs 'herauszuoperieren'
ja, mit dem "PDF-X-Change-Editor" kann man sehr schöne Aufgaben erledigen und er ist fast Freeware. Diese paar wenigen Euros sind sehr gut angelegt.
Von völlig kostenloser Software kann man auch nicht viel erwarten
Hallo @jjunker,
ich habe heute Ihre Mail im Postfach gesehen.
Zu einem Export einer PDF-Datei nach Excel gibt es verschiedene Varianten.
1. gedruckte PDF (Text kann markiert werden)
Laden Sie sich die XPDF-Tool und verwenden Sie das Programm "pdftotext.exe" für einen formatierten Export. Die Tabellenstruktur wird dabei mit Leerzeichen erhalten und kann dann bequem (?) in Excel mit fester Spaltenbreite importiert werden.
pdftotext.exe -layout "SuSa.pdf" "SuSa.txt"
2. gescannte PDF-Datei
Hier wird es extrem schwierig sinnvolle Exporte hinzubekommen. Dazu benötigen Sie einen Reader, wie z. B. den XChange-Viewer.
Gruß Achilleus
Hallo Hr. @vogtsburger,
Von völlig kostenloser Software kann man auch nicht viel erwarten
sorry, aber das ist wirklich Blödsinn.
Nur weil etwas kostenlos ist, heißt das nicht, dass es schlecht ist.
DATEV kostet eine Menge Geld und wie sieht hier die Leistung aus?
Also bitte Vorsicht mit solchen Äußerungen. 🤔
Gruß Achilleus
@Gelöschter Nutzer ,
etwas präziser könnten Sie schon formulieren.
Mit 'rustikaler' Sprache und 'Knüppel aus dem Sack' wird die Kommunikation nicht besser.
Ich habe nicht gesagt, dass kostenlose Software schlecht ist.
Ich habe gesagt, dass man von kostenloser Software nicht viel erwarten kann, ein kleiner, aber feiner Unterschied.
Ich kenne auch kostenlose Software (z.B. Notepad++, Everything, TreeSize u.a.), die hervorragende Funktionen hat und rasend schnell arbeitet, ...
... erwarte aber keine Spitzen-Funktionen, ...
... freue mich aber natürlich, wenn sie vorhanden sind
... also bitte auch mit 'starken Sprüchen' etwas vorsichtiger sein, falls man tatsächlich diskutieren will
( @Dirk_Jendritzki , Sie könnten doch sicher den Titel korrigieren, er liegt mir bei jedem Lesen 'quer im Auge' 😄 )
Ich denke weniger an Soft- sondern eher an Hardware. dem Telefon.
Irgendwie wurde ja aus der Kuh (also der strukturierten Liste) das Gulasch, also die PDF- Datei erstellt.
Vielleicht kann der Mandant ja die Original- Liste als Export produzieren.
Was ist im PDF- Container beinhaltet?
wenn es Textbasiert ist, könnte ein Rauskopieren möglich sein.
Wenn es einfach nur ein Scan ist, dann kann IrfanView mit Plugins den Container öffnen, um die Datei als TIF zu speichern, welches wir nutzen um mittels Office Document Imaging (Kostenlos) die Konvertierung zu starten.
@Gelöschter Nutzer schrieb:
... verwenden Sie das Programm "pdftotext.exe" für einen formatierten Export ...
der Tipp und das Tool ist gut, aber mit dem Format hapert es noch etwas.
... habe mal 'zum Spaß' den Text aus einer umfangreichen (in PDF gedruckten) SUSA exportiert.
... der Text wurde vollständig und sehr schnell exportiert, aber die mit vielen Leerzeichen gefüllen Zwischenräume waren nicht immer spaltengerecht formatiert, sodass noch weitere Bearbeitungsschritte z.B. mit dem Excel-Importassistenten erforderlich sind.
Aber es ist schon eine schöne Erleichterung.
... werde mal testen, ob auch in PDF 'gedruckte' Tabellen aus Webseiten einigermaßen gut formatiert auslesbar sind.
Hallo Hr. @vogtsburger,
sorry, ich wollte Sie nicht angreifen. Aber der vermeintlich schlechte Ruf von OpenSource/Freeware ärgert mich. Es gibt sagenhaft gute Tools, die man aber nicht berücksichtigt, da Sie vermeintlich schlecht sind. Es gibt aber auch eine Menge Mist, dass muss man auch wissen.
Also nichts für Ungut, es ging nicht gegen Sie persönlich.
Zu dem Export:
Es wird versucht, bei der Variante -Layout (ganz wichtig), die Spaltenanordnung durch Leerzeichen zu erhalten. Das klappt je besser, je größer der Zwischenraum zwischen den Spalten ist.
Hier einmal ein Vergleich:
Original-PDF
Konvertierte Textdatei:
(zu erkennen an der Zeilennummer aus Notepad++)
Jetzt braucht man das einfach nur noch in Excel zu importieren, in dem man einfach die Variante feste Spaltenbreite und die Markierungsbegrenzungen verschiebt.
Man sollte hierbei die Textdatei um Ballast bereinigen, wie z. B. Header etc.
Gut klappt es auch, einfach nach mehreren Leerzeichen zu suchen und diese durch ein ";" Semikolon zu ersetzten. Anschließend einfach nach 2 Semikolons suchen und diese wiederum nur durch ein Semikolon zu ersetzen. Dann hat man fast schon ein perfekte CSV-Datei.
Wer Spaß am programmieren hat, macht das natürlich mit ein VBSript. 😃
Gruß Achilleus
bin der Empfehlung von @metalposaunist gefolgt. PDF-Software für bessere Geschäftsergebnisse | Power PDF | Kofax
Testversion ist kostenlos und bietet einen ordentlichen Funktionsumfang. Anschaffungskosten von 91 €.
Ich denke das ist gebongt.
@Gelöschter Nutzer Danke für das Comeback aus der "lesenden" Zone. --> Wieder wichtige Infos geliefert.👍
Nachtrag:
... ich muss meine Aussage noch ein wenig korrigieren:
... das Tool ist interessant, der Text (inkl. der Zahlen) wird gut ausgelesen, aber die Spalten-Formatierung passt gar nicht, jedenfalls nicht bei meiner getesteten eigenen Susa.pdf
Die Spalten sitzen nur zum Teil richtig, mache Spalten sind seitlich um einzelne Zeichen oder gar um komplette Spaltenpositionen verschoben.
(edit: ... das passiert übrigens auch mit anderen Texten (PDF-Dateien), die Tabellen enthalten ...)
Vielleicht ist das aber innerhalb des Tools oder mit den Kommandozeilen-Parametern noch einstellbar
Insgesamt ist das Exportieren von Tabellen aus PDFs nicht so trivial wie es auf den ersten Blick (am Bildschirm) aussieht.
Übrigens, wenn die Tabelle 'schön' formatiert in einer (ASCII/ANSI/Word)Textdatei steht, könnte man auch selektiv Spalten kopieren und woanders einfügen. Diese Funktion (z.B. in Word oder Notepad++ u.a.) ist wenig bekannt, aber natürlich ein 'alter Hut' bei den Word-/Excel-Routiniers in der Datev-Community.
Nachtrag:
...alsoooohooo ...:
.. bevor man Klimmzüge oder doppelte Salti mit dreifacher Schraube macht, sollte man jede Chance nutzen, tabellarisches Datenmaterial im Original, also z.B. als CSV-Export aus dem Banking-Programm oder aus anderen Quellen zu erhalten und zu 'verwerten'. Alles Andere ist 'von hinten durch's Knie in's Auge geschossen' (oder so ähnlich)
Ich würd das Thema gern noch mal aufgreifen.
Ist die Excel-Lösung hier in der Runde tatsächlich das Mittel der Wahl? Bei Unmengen an Käufen und Verkäufen kann man doch da den Überblick kaum behalten und hat auch gar nicht die Zeit, das alles aufzubereiten. Mittlerweile gibts doch da sicher andere effektivere Lösungen? Exporte der Bank in eine brauchbare Software einspielen beispielsweise? Oder ist das Wunschtraum?
Danke für Infos
und viele Grüße!
Anika Strauß
Vielleicht gibt es hier Hinweise, wie man mit Microsoft Bordmitteln Pdf‘s in Excel Dateien verwandeln kann.
VG Sven Ehlers
Hallo @anikastrauß ,
ich würde jetzt das Folgende schreiben, wenn ich es nicht schon in meinem Beitrag (Nr. 16, direkt vor Ihrem Beitrag) geschrieben hätte ;-):
.. bevor man 'Klimmzüge' oder 'doppelte Salti mit dreifacher Schraube' macht, sollte man jede Chance nutzen, tabellarisches Datenmaterial im Original, also z.B. als CSV-Export aus dem Banking-Programm oder aus anderen Quellen zu erhalten und zu 'verwerten'. Alles Andere ist 'von hinten durch's Knie in's Auge geschossen'
@anikastrauß Ich kann mich @vogtsburger nur anschließen. Rohdaten wann immer möglich in maschinen lesbarer Form als Export.
Man wird aber leider öfter als man möchte in die Lage gedrängt Daten nicht in maschinenlesbarer Rohform sondern als PDF zu bekommen.
Dabei liefert KOFAX auch von einem Scan weg ein Ergebnis von dem die DATEV OCR nicht mal träumen lässt.
Beispiel Aktiendepotbestandslisten. 13 Seiten Papier Dollar Kurs Zukauf Verkauf ...... einziger Fehler der öfter auftrat war das Dollarzeichen statt der 5 gelesen wurde. Wie auch immer das zusammenhängen mag 🤗. Die 13 Seiten hätte man auch abtippen können oder man schleust Sie durch KOFAX und bekommt gute Rohdaten.
Wer OCR-Tools kennt, die zuverlässig Zahlen erkennen - was gemäß @jjunker KOFAX wohl ganz gut kann, sollte sich diese gut merken und hier gerne aufzählen.
Die offline Tools (zumindest in Freeware) sind hier- weil i.d.R. auf Text mit Wörterbuchabgleich ausgelegt - m.E. sehr unzuverlässig und erfordern eine hochsensible Nachkontrolle - wenn hier keine Prüfwerte aus den Daten ermittelt werden können, ist das m.E. schon sehr fehleranfällig.
Falls das PDF aber kein Scan ist und die Zahlen als Datenwerte enthält, dann kann man, wenn die Tabellen nicht gleich direkt kopiert und in Excel eingefügt werden können (z.B. weil Spalten oder Zeilen nicht getrennt werden) das pdf in MS Word öffnen (dabei konvertieren lassen), womit die Tabellen häufig als solche korrekt in einem Excel-kompatiblem Format dargestellt werden und besser nach Excel kopiert werden können. Probleme treten dann auf, wenn viele Tabellen verschachtelt sind.
Auch die Zwischenbearbeitung des Word Dokuments kann die Konvertierung weiter verbessern.
Bei Text müssen häufig Zeilenumbrüche in den Tabellenzellen vermieden werden, weil Excel sonst das weitere Handling erschwerende kombinierte Zellen erzeugt - ich ersetze die Zeilenwechsel dann durch geeignete Platzhalter und später in Excel wieder zurück.
Dies sollte jedoch bei Zahlen i.d.R. nicht notwendig sein. Dort müssen aber ggf. Tausendertrennzeichen, Kommas oder Einheiten bearbeitete werden. Weil dies alles zumindest teilautomatisiert geht, ist das letztlich bei genügend Datensätzen immer noch effizient.
Viele Grüße