Zum Inhalt springen

Inhalte aus PDF extrahieren (OCR)

Symbol zum Extrahieren von Inhalten aus PDF

Mit dem Text To Table Converter Add-On können Sie eine Optische Zeichenerkennung (OCR) bei PDF-Dateien durchführen, um alle Inhalte – einschließlich Text, Absätze, Listen, Tabellen und mathematische Formeln – zu extrahieren und als vollständig bearbeitbare Elemente direkt in Ihr Dokument in Google Docs™, Google Slides™ oder Google Sheets™ einzufügen.


Inhalte aus PDF extrahieren

Diese Funktion analysiert das Layout und die Struktur jeder PDF-Seite und wandelt visuelle Elemente intelligent in bearbeitbare Inhalte um, wobei die ursprüngliche Formatierung als Markdown erhalten bleibt.

Animation, die den neuen PDF-Extraktions-Workflow aus PDF zeigt

  1. Öffnen Sie das Werkzeug “Inhalt aus PDF extrahieren” Navigieren Sie durch das Google Workspace™-Menü: Erweiterungen > Text To Table Converter > 🪄 PDF-Werkzeuge > Inhalt aus PDF extrahieren.

  2. Wählen Sie eine PDF-Datei aus Das Werkzeug wird geöffnet und Sie werden aufgefordert, eine Datei auszuwählen. Sie können eine PDF-Datei aus Ihrem Google Drive™ auswählen oder eine direkt von Ihrem Computer hochladen.

  3. Wählen Sie die zu extrahierenden Seiten aus Sobald eine PDF-Datei geladen ist, zeigt das Werkzeug ein Raster mit Miniaturansichten für jede Seite des Dokuments an.

    • Klicken Sie auf bis zu 3 Seiten, aus denen Sie Inhalte extrahieren möchten. Ausgewählte Seiten werden hervorgehoben.
    • Um eine größere Vorschau einer Seite anzuzeigen, doppelklicken Sie auf die Miniaturansicht.
  4. Extrahieren Sie den Inhalt Nachdem Sie Ihre Seiten ausgewählt haben, klicken Sie auf die Schaltfläche Seite(n) extrahieren. Das Add-on verarbeitet jede ausgewählte Seite einzeln und fügt den extrahierten Inhalt in Ihr aktives Dokument ein.

    • Die KI erkennt und konvertiert automatisch alle Inhaltstypen, einschließlich Absätze, Listen und Tabellen.
    • Grundlegende Formatierungen wie Fett, Kursiv und Code bleiben erhalten.

Spezialfunktion: LaTeX-Formelextraktion

Eine Schlüsselfunktion des PDF-Extraktors ist seine Fähigkeit, mathematische und wissenschaftliche Formeln zu erkennen und sie automatisch in die Standard-LaTeX-Notation umzuwandeln (z. B. $$E=mc^2$$).

Diese reine Textnotation kann dann mithilfe der integrierten LaTeX-Werkzeuge des Add-ons sofort in ein hochwertiges Gleichungsbild umgewandelt werden, was einen nahtlosen Arbeitsablauf von der PDF-Datei bis zum perfekt formatierten Dokument ermöglicht.