20M小模型的数学公式OCR，复杂公式截图秒转LaTeX代码！

显示全部楼层

对于常写文档、做数学研究、准备学术论文的同学来说，数学公式 LaTeX 化几乎是绕不开的痛点。

不过最近我发现了一个非常轻量、却非常强大的开源数学公式 OCR 模型 —Texo。

一个只有 20M 参数的小模型，识别准确度却能达到 BLEU 0.85+，关键是还能直接在浏览器中运行，零成本在线使用。

对于一个 OCR 公式识别模型来说，这是相当夸张的表现。

Texo上手零门槛，浏览器直用或本地部署。

官方直接上线有 Demo 版本，可以直接在浏览输入以下地址使用，上传图片即可。

https://texocr.netlify.app/ocr

配置环境

gitclonehttps://github.com/alephpi/Texo
uvsync

下载模型

# model only
python scripts/python/hf_hub.py pull

按经验来说，OCR + 数学公式解析是一项非常复杂的任务：

理论上，小模型很难完成，但Texo居然做到了。

原因大概包含以下几点：

总之，Texo 的强大不是偶然，而是合理的技术路线 + 轻量化设计的优势结合。

如果你经常与数学公式、LaTeX 打交道，那么你真的应该收藏 Texo。

它的优势非常明显：不仅轻量、准确度高、浏览器直跑，还开源、易集成。

真正把高难度的数学公式 OCR 技术拉到了大众可用的层级。