Saltearse al contenido

Extraer contenido de PDF (OCR)

Icono de extraer contenido de PDF

Con el complemento Text To Table Converter, puede realizar un Reconocimiento Óptico de Caracteres (OCR) en archivos PDF para extraer todo el contenido —incluyendo texto, párrafos, listas, tablas y fórmulas matemáticas— e insertarlo como elementos completamente editables directamente en su documento de Documentos de Google™, Presentaciones de Google™ u Hojas de Cálculo de Google™.


Extraer contenido de PDF

Esta función analiza el diseño y la estructura de cada página del PDF, convirtiendo de manera inteligente los elementos visuales en contenido editable mientras preserva el formato original como Markdown.

Animación que muestra el nuevo flujo de trabajo de extracción de PDF

  1. Abra la herramienta “Extraer Contenido de PDF” Navegue a través del menú de Google Workspace™: Extensiones > Text To Table Converter > 🪄 Herramientas PDF > Extraer Contenido de PDF.

  2. Seleccione un archivo PDF La herramienta se abrirá, solicitándole que seleccione un archivo. Puede elegir un PDF de su Google Drive™ o subir uno directamente desde su computadora.

  3. Elija las páginas para extraer Una vez que se carga un PDF, la herramienta mostrará una cuadrícula de vistas previas en miniatura de cada página del documento.

    • Haga clic en hasta 3 páginas de las que desee extraer contenido. Las páginas seleccionadas se resaltarán.
    • Para ver una vista previa más grande de una página, haga doble clic en su miniatura.
  4. Extraiga el contenido Después de seleccionar sus páginas, haga clic en el botón Extraer Página(s). El complemento procesará cada página seleccionada individualmente e insertará el contenido extraído en su documento activo.

    • La IA identifica y convierte automáticamente todos los tipos de contenido, incluyendo párrafos, listas y tablas.
    • Se conserva el formato básico como negrita, cursiva y código.

Función Especial: Extracción de Fórmulas LaTeX

Una característica clave del extractor de PDF es su capacidad para reconocer fórmulas matemáticas y científicas y convertirlas automáticamente a la notación estándar de LaTeX (p. ej., $$E=mc^2$$).

Esta notación de texto plano puede ser renderizada instantáneamente en una imagen de ecuación de alta calidad utilizando las herramientas de LaTeX integradas en el complemento, creando un flujo de trabajo fluido desde el PDF hasta un documento perfectamente formateado.