PDF hier ablegen
oder klicken zum Auswählen
Das Werkzeug liest die Text-Ebene einer PDF-Datei aus und gibt sie als reinen Text wieder. Genutzt wird die Open-Source-Bibliothek pdf.js, die auch Mozilla in Firefox einsetzt. Die Verarbeitung läuft vollständig im Browser: deine Datei wird nicht hochgeladen.
Reihenfolge und Zeilenumbrüche bleiben grundsätzlich erhalten. Sehr feine Layouts (mehrspaltige Seiten, Tabellen, Marginalien) können beim Export zerfließen — das ist eine prinzipielle Grenze der Text-Extraktion, nicht ein Bug. Die Option „Soft-Wraps zusammenführen“ glättet Fließtext, indem sie Zeilen verbindet, die nur durch Spaltenbreite umgebrochen wurden.
Da kein Datei-Inhalt an einen Server gesendet wird, eignet sich das Werkzeug auch für sensible Dokumente. Details in der Datenschutzerklärung.
Nein. Das Werkzeug liest nur tatsächlich enthaltene Text-Ebenen aus. Bei reinen Scan-PDFs (also Bildern auf Papier-Seiten) gibt es keinen Text zum Extrahieren — dafür gibt es das separate Werkzeug OCR · Texterkennung.
Nein. Das Werkzeug läuft komplett im Browser auf deinem Gerät — siehe Datenschutzerklärung.
Nur bedingt. Reihenfolge und Zeilenumbrüche werden übernommen, sehr feine Layouts (Spalten, Tabellen) können beim Export aber zerfließen. Optional lassen sich Soft-Wraps zusammenführen, um Fließtext zu glätten.
Ja. Nach dem ersten Laden ist die Seite als Progressive Web App offline verfügbar.