跳到內容

從 PDF 提取內容 (OCR)

從PDF提取內容圖示

使用 Text To Table Converter 附加元件,您可以對 PDF 檔案執行光學字元辨識 (OCR),以提取所有內容——包括文字、段落、清單、表格和數學公式——並將其作為完全可編輯的元素直接插入到您的 Google 文件™、Google 簡報™ 或 Google 試算表™ 文件中。


從 PDF 提取內容

此功能會分析每個 PDF 頁面的佈局和結構,智能地將視覺元素轉換為可編輯的內容,同時保留原始格式為 Markdown。

顯示從PDF提取PDF內容的動畫

  1. 開啟「從PDF提取內容」工具 透過 Google Workspace™ 選單導覽: 擴充功能 > Text To Table Converter > 🪄 PDF 工具 > 從 PDF 提取內容

  2. 選擇一個 PDF 檔案 工具將會開啟,提示您選擇一個檔案。您可以從 Google 雲端硬碟™ 選擇 PDF,或直接從您的電腦上傳。

  3. 選擇要提取的頁面 PDF 載入後,工具將顯示文件中每個頁面的縮圖預覽網格。

    • 點擊最多 3 個 您希望提取內容的頁面。選定的頁面將會被反白標示。
    • 若要查看頁面的較大預覽,請雙擊其縮圖。
  4. 提取內容 選擇頁面後,點擊 提取頁面 按鈕。附加元件將單獨處理每個選定的頁面,並將提取的內容插入到您的活動文件中。

    • AI 會自動識別並轉換所有內容類型,包括段落、清單和表格。
    • 粗體斜體程式碼 等基本格式將被保留。

特色功能:LaTeX 公式提取

PDF 提取器的一項關鍵功能是它能夠識別數學和 wissenschaftliche 公式,並自動將它們轉換為標準的 LaTeX 表示法(例如 $$E=mc^2$$)。

然後,可以使用附加元件內建的 LaTeX 工具將此純文字表示法立即渲染成高品質的方程式圖片,從而建立從 PDF 到完美格式化文件的無縫工作流程。