Extraire le contenu d'un PDF (OCR)
Avec le module complémentaire Text To Table Converter, vous pouvez effectuer une Reconnaissance Optique de Caractères (OCR) sur des fichiers PDF pour extraire tout le contenu — y compris le texte, les paragraphes, les listes, les tableaux et les formules mathématiques — et l’insérer en tant qu’éléments entièrement modifiables directement dans votre document Google Docs™, Google Slides™ ou Google Sheets™.
Extraire le contenu d’un PDF
Cette fonctionnalité analyse la mise en page et la structure de chaque page du PDF, convertissant intelligemment les éléments visuels en contenu modifiable tout en préservant la mise en forme originale en Markdown.
-
Ouvrez l’outil “Extraire le Contenu du PDF” Naviguez dans le menu de Google Workspace™ :
Extensions
>Text To Table Converter
>🪄 Outils PDF
>Extraire le Contenu du PDF
. -
Sélectionnez un fichier PDF L’outil s’ouvrira, vous invitant à sélectionner un fichier. Vous pouvez choisir un PDF depuis votre Google Drive™ ou en télécharger un directement depuis votre ordinateur.
-
Choisissez les pages à extraire Une fois qu’un PDF est chargé, l’outil affichera une grille d’aperçus miniatures pour chaque page du document.
- Cliquez sur jusqu’à 3 pages dont vous souhaitez extraire le contenu. Les pages sélectionnées seront mises en surbrillance.
- Pour voir un aperçu plus grand d’une page, double-cliquez sur sa miniature.
-
Extraire le contenu Après avoir sélectionné vos pages, cliquez sur le bouton Extraire Page(s). Le module complémentaire traitera chaque page sélectionnée individuellement et insérera le contenu extrait dans votre document actif.
- L’IA identifie et convertit automatiquement tous les types de contenu, y compris les paragraphes, les listes et les tableaux.
- La mise en forme de base telle que le gras, l’italique et le
code
est préservée.
Fonctionnalité Spéciale : Extraction de Formules LaTeX
Une caractéristique clé de l’extracteur de PDF est sa capacité à reconnaître les formules mathématiques et scientifiques et à les convertir automatiquement en notation LaTeX standard (par ex., $$E=mc^2$$
).
Cette notation en texte brut peut ensuite être instantanément transformée en une image d’équation de haute qualité à l’aide des outils LaTeX intégrés au module complémentaire, créant ainsi un flux de travail transparent du PDF à un document parfaitement formaté.