Anleitungen

PDF- und Bildtools

Inhalt aus PDF oder Bildern extrahieren (OCR)

Erfahren Sie, wie Sie mit dem Text To Table Converter Add-On für Google Docs™, Google Slides™ und Google Sheets™ Inhalte aus PDFs oder Bildern extrahieren.

Mit dem Text To Table Converter Add-On können Sie eine Optische Zeichenerkennung (OCR) bei PDF- oder Bilddateien durchführen, um alle Inhalte – einschließlich Text, Absätze, Listen, Tabellen und mathematische Formeln – zu extrahieren und als vollständig bearbeitbare Elemente direkt in Ihr Dokument in Google Docs™, Google Slides™ oder Google Sheets™ einzufügen.


Inhalt aus PDF oder Bildern extrahieren

Diese Funktion analysiert das Layout und die Struktur jeder PDF-Seite und wandelt visuelle Elemente intelligent in bearbeitbare Inhalte um, wobei die ursprüngliche Formatierung als Markdown erhalten bleibt.

  1. Öffnen Sie das Werkzeug "Inhalt aus PDF oder Bildern extrahieren"

Navigieren Sie durch das Google Workspace™-Menü: Erweiterungen > Text To Table Converter > 🪄 PDF- & Bildwerkzeuge > Inhalt aus PDF oder Bildern extrahieren.

  1. Wählen Sie eine PDF-Datei oder ein Bild aus

Das Werkzeug wird geöffnet und Sie werden aufgefordert, eine Datei auszuwählen. Sie können eine PDF-Datei oder ein Bild aus Ihrem Google Drive™ auswählen oder eine direkt von Ihrem Computer hochladen.

  1. Wählen Sie die zu extrahierenden Seiten aus (PDFs)

Sobald eine PDF-Datei geladen ist, zeigt das Werkzeug ein Raster mit Miniaturansichten für jede Seite des Dokuments an. Für Bilder wird das ausgewählte Bild als Vorschau zur Extraktion angezeigt.

  • Klicken Sie auf bis zu 3 Seiten, aus denen Sie Inhalte extrahieren möchten. Ausgewählte Seiten werden hervorgehoben.
  • Um eine größere Vorschau einer Seite anzuzeigen, doppelklicken Sie auf die Miniaturansicht.
  1. Extrahieren Sie den Inhalt

Nachdem Sie Ihre Seiten ausgewählt oder Ihr Bild bestätigt haben, klicken Sie auf die Schaltfläche Seite(n) extrahieren. Das Add-on verarbeitet jede ausgewählte Seite oder jedes Bild einzeln und fügt den extrahierten Inhalt in Ihr aktives Dokument ein.

  • Die KI erkennt und konvertiert automatisch alle Inhaltstypen, einschließlich Absätze, Listen und Tabellen.
  • Grundlegende Formatierungen wie Fett, *Kursiv* und Code bleiben erhalten.

Spezialfunktion: LaTeX-Formelextraktion

Eine Schlüsselfunktion des PDF-Extraktors ist seine Fähigkeit, mathematische und wissenschaftliche Formeln zu erkennen und sie automatisch in die Standard-LaTeX-Notation umzuwandeln (z. B. $$E=mc^2$$).

Diese reine Textnotation kann dann mithilfe der integrierten LaTeX-Werkzeuge des Add-ons sofort in ein hochwertiges Gleichungsbild umgewandelt werden, was einen nahtlosen Arbeitsablauf von der PDF-Datei bis zum perfekt formatierten Dokument ermöglicht.

  • LaTeX-Auswahl umwandeln - Ein Ein-Klick-Werkzeug zum Umschalten von ausgewähltem LaTeX-Code zwischen reinem Text und einem gerenderten Bild.

Überprüfen Sie immer KI-generierte Inhalte: Obwohl die KI sehr genau ist, können komplexe oder ungewöhnliche Layouts in einer PDF-Datei oder einem Bild manchmal zu Extraktionsfehlern oder Formatierungsinkonsistenzen führen. Es wird immer empfohlen, den eingefügten Inhalt zu überprüfen, um seine Genauigkeit im Vergleich zur ursprünglichen PDF-Datei oder dem Bild zu verifizieren.