|
对于常写文档、做数学研究、准备学术论文的同学来说,数学公式 LaTeX 化几乎是绕不开的痛点。 不过最近我发现了一个非常轻量、却非常强大的开源数学公式 OCR 模型 —Texo。 一个只有 20M 参数的小模型,识别准确度却能达到 BLEU 0.85+,关键是还能直接在浏览器中运行,零成本在线使用。 对于一个 OCR 公式识别模型来说,这是相当夸张的表现。 核心亮点- •识别精度高:识别精度媲美百兆级模型,输出 LaTeX 几乎无需二次修改。
快速入手Texo上手零门槛,浏览器直用或本地部署。 官方直接上线有 Demo 版本,可以直接在浏览输入以下地址使用,上传图片即可。 https://texocr.netlify.app/ocr 配置环境 gitclonehttps://github.com/alephpi/Texo uvsync
下载模型 # model only python scripts/python/hf_hub.py pull
为什么 20M 模型能做到这么强?按经验来说,OCR + 数学公式解析是一项非常复杂的任务: 理论上,小模型很难完成,但Texo居然做到了。 原因大概包含以下几点: - • 任务本身是结构化的,不是完全自由文本。不像自然语言,公式的组合方式是有限的。
- • 训练数据高质量、结构明确。数学 OCR 有大量高质量的 LaTeX 渲染数据可用。
- • 针对公式任务优化的 Transformer 结构。
总之,Texo 的强大不是偶然,而是合理的技术路线 + 轻量化设计的优势结合。 实际使用场景- •写论文(LaTeX):PDF 里的公式截图 → Texo → LaTeX → 直接粘贴。
- •做课堂笔记:把书本、PDF、黑板、老师投影的内容快速转为LaTeX。
写在最后如果你经常与数学公式、LaTeX 打交道,那么你真的应该收藏 Texo。 它的优势非常明显:不仅轻量、准确度高、浏览器直跑,还开源、易集成。 真正把高难度的数学公式 OCR 技术拉到了大众可用的层级。 |