跳转到内容

从 PDF 提取内容 (OCR)

从PDF提取内容图标

使用 Text To Table Converter 插件,您可以对 PDF 文件执行光学字符识别 (OCR),以提取所有内容——包括文本、段落、列表、表格和数学公式——并将其作为完全可编辑的元素直接插入到您的 Google 文档™、Google 幻灯片™ 或 Google 表格™ 文档中。


从 PDF 提取内容

此功能会分析每个 PDF 页面的布局和结构,智能地将视觉元素转换为可编辑的内容,同时保留原始格式为 Markdown。

显示从PDF提取内容的新工作流程动画

  1. 打开“从PDF提取内容”工具 通过 Google Workspace™ 菜单导航: 扩展程序 > Text To Table Converter > 🪄 PDF 工具 > 从PDF提取内容

  2. 选择一个 PDF 文件 工具将打开,提示您选择一个文件。您可以从您的 Google Drive™ 中选择一个 PDF,或直接从您的计算机上传一个。

  3. 选择要提取的页面 加载 PDF 后,该工具将显示文档中每个页面的缩略图预览网格。

    • 点击最多 3 个您希望提取内容的页面。选定的页面将被高亮显示。
    • 要查看页面的更大预览,请双击其缩略图。
  4. 提取内容 选择页面后,点击 提取页面 按钮。插件将单独处理每个选定的页面,并将提取的内容插入到您的活动文档中。

    • AI 会自动识别并转换所有内容类型,包括段落、列表和表格。
    • 保留了粗体斜体代码 等基本格式。

特色功能:LaTeX 公式提取

PDF 提取器的一个关键功能是它能够识别数学和科学公式,并自动将它们转换为标准的 LaTeX 表示法(例如,$$E=mc^2$$)。

然后,可以使用插件内置的 LaTeX 工具将此纯文本表示法立即呈现为高质量的公式图像,从而创建一个从 PDF 到完美格式化文档的无缝工作流程。