从 PDF 提取内容 (OCR)
使用 Text To Table Converter 插件,您可以对 PDF 文件执行光学字符识别 (OCR),以提取所有内容——包括文本、段落、列表、表格和数学公式——并将其作为完全可编辑的元素直接插入到您的 Google 文档™、Google 幻灯片™ 或 Google 表格™ 文档中。
从 PDF 提取内容
此功能会分析每个 PDF 页面的布局和结构,智能地将视觉元素转换为可编辑的内容,同时保留原始格式为 Markdown。
-
打开“从PDF提取内容”工具 通过 Google Workspace™ 菜单导航:
扩展程序
>Text To Table Converter
>🪄 PDF 工具
>从PDF提取内容
。 -
选择一个 PDF 文件 工具将打开,提示您选择一个文件。您可以从您的 Google Drive™ 中选择一个 PDF,或直接从您的计算机上传一个。
-
选择要提取的页面 加载 PDF 后,该工具将显示文档中每个页面的缩略图预览网格。
- 点击最多 3 个您希望提取内容的页面。选定的页面将被高亮显示。
- 要查看页面的更大预览,请双击其缩略图。
-
提取内容 选择页面后,点击 提取页面 按钮。插件将单独处理每个选定的页面,并将提取的内容插入到您的活动文档中。
- AI 会自动识别并转换所有内容类型,包括段落、列表和表格。
- 保留了粗体、斜体和
代码
等基本格式。
特色功能:LaTeX 公式提取
PDF 提取器的一个关键功能是它能够识别数学和科学公式,并自动将它们转换为标准的 LaTeX 表示法(例如,$$E=mc^2$$
)。
然后,可以使用插件内置的 LaTeX 工具将此纯文本表示法立即呈现为高质量的公式图像,从而创建一个从 PDF 到完美格式化文档的无缝工作流程。
快速方程式:插入和编辑 直接从侧边栏创建、编辑和渲染 LaTeX 方程式的最快方法。
转换 LaTeX 选区 一键式工具,可在纯文本和渲染图像之间切换选定的 LaTeX 代码。