工具使用

使用 Pix2Text 将复杂 PDF 文档进行 OCR 识别并转换为 LaTeX / Markdown

Published: 2026-04-04

在学术研究或日常工作中,我们经常会遇到需要将扫描版 PDF 文档或包含复杂数学公式的书籍提取为可编辑的 Markdown 或 LaTeX 源码的需求。传统的文字识别(OCR)工具往往对版面结构和复杂的数学公式无能为力,而 Pix2Text 则提供了一套强大且开源的解决方案。本文将详细记录在 macOS 环境下,从安装配置环境、下载核心深度学习模型,到最终成功把 PDF 转换为包含公式的 Markdown 文件的完整流程。