Zum Inhalt springen

Inhalt aus PDF oder Bildern extrahieren (OCR)

Symbol zum Extrahieren von Inhalten aus PDF

Mit dem Text To Table Converter Add-On können Sie eine Optische Zeichenerkennung (OCR) bei PDF- oder Bilddateien durchführen, um alle Inhalte – einschließlich Text, Absätze, Listen, Tabellen und mathematische Formeln – zu extrahieren und als vollständig bearbeitbare Elemente direkt in Ihr Dokument in Google Docs™, Google Slides™ oder Google Sheets™ einzufügen.


Diese Funktion analysiert das Layout und die Struktur jeder PDF-Seite und wandelt visuelle Elemente intelligent in bearbeitbare Inhalte um, wobei die ursprüngliche Formatierung als Markdown erhalten bleibt.

Animation, die den neuen Extraktions-Workflow aus PDF oder Bild zeigt

  1. Öffnen Sie das Werkzeug “Inhalt aus PDF oder Bildern extrahieren” Navigieren Sie durch das Google Workspace™-Menü: Erweiterungen > Text To Table Converter > 🪄 PDF- & Bildwerkzeuge > Inhalt aus PDF oder Bildern extrahieren.

  2. Wählen Sie eine PDF-Datei oder ein Bild aus Das Werkzeug wird geöffnet und Sie werden aufgefordert, eine Datei auszuwählen. Sie können eine PDF-Datei oder ein Bild aus Ihrem Google Drive™ auswählen oder eine direkt von Ihrem Computer hochladen.

  3. Wählen Sie die zu extrahierenden Seiten aus (PDFs) Sobald eine PDF-Datei geladen ist, zeigt das Werkzeug ein Raster mit Miniaturansichten für jede Seite des Dokuments an. Für Bilder wird das ausgewählte Bild als Vorschau zur Extraktion angezeigt.

    • Klicken Sie auf bis zu 3 Seiten, aus denen Sie Inhalte extrahieren möchten. Ausgewählte Seiten werden hervorgehoben.
    • Um eine größere Vorschau einer Seite anzuzeigen, doppelklicken Sie auf die Miniaturansicht.
  4. Extrahieren Sie den Inhalt Nachdem Sie Ihre Seiten ausgewählt oder Ihr Bild bestätigt haben, klicken Sie auf die Schaltfläche Seite(n) extrahieren. Das Add-on verarbeitet jede ausgewählte Seite oder jedes Bild einzeln und fügt den extrahierten Inhalt in Ihr aktives Dokument ein.

    • Die KI erkennt und konvertiert automatisch alle Inhaltstypen, einschließlich Absätze, Listen und Tabellen.
    • Grundlegende Formatierungen wie Fett, Kursiv und Code bleiben erhalten.

Eine Schlüsselfunktion des PDF-Extraktors ist seine Fähigkeit, mathematische und wissenschaftliche Formeln zu erkennen und sie automatisch in die Standard-LaTeX-Notation umzuwandeln (z. B. $$E=mc^2$$).

Diese reine Textnotation kann dann mithilfe der integrierten LaTeX-Werkzeuge des Add-ons sofort in ein hochwertiges Gleichungsbild umgewandelt werden, was einen nahtlosen Arbeitsablauf von der PDF-Datei bis zum perfekt formatierten Dokument ermöglicht.