沉浸式翻译杀疯了！双重开源：左手像素级还原PDF排版，右手本地AI隐私保护！ - 链载Ai

在这个互联网时代，我们每天的工作都离不开大量的英文阅览，不论是看 GitHub 上的技术文档，或是 arXiv 上的最新论文，以及一些外文 PDF 文档和偏英文语言显示的社交网站。

这个时候有个好用的翻译工具尤为重要！这就不得不提到在 AI 元年横空出世的全能翻译工具：「沉浸式翻译」。

它是一款基于 AI 驱动的跨平台在线翻译工具，提供网页、文档、视频等内容的实时双语对照翻译体验。

我们通过它可以免费即时翻译外语网页、PDF文档、ePub电子书、字幕文件、在线视频字幕、图片等内容，并以原文+译文对照形式呈现。

主要功能有网页翻译（沉浸式阅读）、鼠标悬停翻译、输入框翻译、文档翻译、在线视频字幕翻译、会议翻译、图片翻译、漫画翻译等。

目前主流的使用方式是通过浏览器插件的形式，适⽤于Chrome、Edge、Firefox、Safari等主流浏览器。安装后浏览任意外语⽹⻚即可启⽤翻译功能。即使不注册不登录也可以使用其提供的免费 AI 模型进行翻译。

从2023年横空出世，到狂揽全球1000万+用户，再到2024年底斩获Google Chrome 网上应用商店年度精选扩展程序殊荣，它几乎凭一己之力改变了我们阅读外语信息的习惯。

但今天，想说的是它最新推出的两个核弹级的功能：专治PDF排版乱码的「BabelDoc」和首个开源本地AI隐私防火墙「OneAIFW」。

更令人震惊的是——他们把这两个核心技术都开源了！

无论你是被英文文献折磨的科研党，还是担心机密泄露的职场人，这篇文章你一定要看完。这不仅仅是工具的迭代，更是AI翻译体验的一次降维打击。

BabelDoc：重塑 PDF 阅读体验

研发背景

在PDF翻译场景中，传统机器翻译⼯具往往⾯临在“精准翻译”与“排版保全”之间难以两全的问题。而面临的后果就是：数学公式逻辑断裂、复杂的图文排版错位、原始版式严重⾛样，阅读体验极差，甚至因为格式混乱导致理解偏差。

沉浸式翻译团队显然也深入调研了这些用户痛点，于是他们推出了专为PDF场景打造的全新 AI 翻译工具：BabelDoc。

核心功能与亮点

BabelDoc 是沉浸式翻译团队专门针对 PDF 场景研发的全新 AI 翻译引擎。

•无损解析能力：它能完整提取 PDF 内嵌的非文本元素（图表、脚注、公式），确保这些元素在翻译过程中不丢失、不损坏。
•像素级还原：译文与源文件保持“像素级”对齐。无论你的原文档是双栏排版还是复杂的图文混排，翻译后依然维持原样。
•智能结构识别：自动识别学术论文、招股书、白皮书等专业文档结构，跨页、跨栏的段落也能自动重组，保证语句通顺。
•术语一致性：支持术语库协同，锁定高频专业词汇的统一译法（这一点对看财报和技术文档非常重要）。
•AI 风格化翻译：提供⻆⾊提⽰词（如学术译者/法律审校/技术写作者等），可保存模板，统⼀语⽓与体裁。

快速使用

目前 BabelDoc 处于Beta 阶段，所有⽤⼾都可以直接使⽤。

•免费用户：每月享有50万 Token的额度！使用的是 GLM-4-FLASH 大模型。对于偶尔读几篇论文的学生党完全够用。
•Pro/Max会员：每月分别高达 2000万/5000万 Token，还能解锁更高级的模型。

大家在浏览器中安装好「沉浸式翻译」插件后，点击插件图标->选择最下方的「更多」->选择「BabelDoc PDF 翻译」即可跳转 BabelDoc 翻译页面。

当然也可以直接访问下面的地址直接使用 BabelDoc 功能。

https://app.immersivetranslate.com/babel-doc

场景实测

光说不练假把式。为了验证 BabelDoc 的真实实力，我找了三种最容易“翻车”的 PDF 文档进行了实测。

场景 A：公式保护

测试样本： arXiv 深度学习论文，包含大量公式。

我们去 arVix 上找到一份包含大量公式的论文，下载为 PDF 后，上传到 BabelDoc 工具页面，模型可以自己指定单个模型或搭配多模型，页面也可以自由指定某一页进行翻译。

等待几分钟，看看实测结果：

可以看出 BabelDoc 完美识别了数学符号及相应的公式。它只翻译“人话”，绝不碰公式。所有的上下标、推导逻辑纹丝不动。这对科研党来说简直是救命功能。

此外，我也顺便启用了自动提取术语表的功能，点击右上角「下载自动提取的术语表」即可查看PDF中存在的一些术语，可以用来弥补学习我们原有的知识空白。

场景 B：图表混排

测试样本： IPhone17 Pro 产品环境报告，包含饼图和嵌入式文字。还有一些复杂图形案例。

从结果上看，饼状图内英文被精准替换为中文，形状位置不变，无损解析，颜色、线条与原版 1:1 复刻。

还有下面的这种文字+图形的场景下，也能正常处理到位。

场景 C：排版美学

测试样本：包含头像、文字、多级标题、多种段落的公开研报。

从实测结果看，通过 BabelDoc 翻译的文档可以精确识别文档结构与段落布局。译文与原文智能对齐，且原文的加粗、颜色标注全部保留，且智能匹配了非常舒适的中文字体，阅读体验极佳。

在 BableDoc 如此优质的翻译服务下，同时它还是开源的产品，目前已经在 GitHub 揽获 7.1K Star！有相应文档翻译需求的个人或团队也可部署在本地或集成在自家的产品上。

开源地址：https://github.com/funstory-ai/BabelDOC

目前 BabelDoc 处于 Beta 阶段，免费版用户每月也有 50 万 Token 额度，足够日常翻译需求了！

OneAIFW：给 AI 翻译穿上“防弹衣”

研发背景

在 AI 时代，我们陷入了一个两难境地：想用 Gemini 等强大模型的翻译能力，就必须把数据传到云端；想保护隐私，就只能用由于算力限制而不够智能的本地模型。

•用户困境：AI 翻译虽⾼效，但上传的⽂本中往往包含敏感信息（客⼾资料、账号、合同、验证码等）。
•⾏业痛点：⼤多数翻译服务在传输到云端前，数据处于“裸露”状态，有潜在被⽤于模型训练或泄露的⻛险。
•现有⽅案不⾜：本地部署成本⾼昂、算⼒有限；云端⽅案则隐私⻛险难控。

为了解决这些安全问题，沉浸式翻译也开源了另一款工具：OneAIFW (One AI Firewall) — 本地 AI 防火墙。

在沉浸式翻译里使用，也可以在不牺牲云端 AI 能⼒的前提下，实现“⽤⼾隐私只留在本地”的安全翻译。

核心功能与原理

OneAIFW 的定位非常清晰：让“AI 翻译”第一次具备可验证的隐私保护能力。它采用独创的“三段式”脱敏技术：

1.本地脱敏 (Local Masking)：在你的浏览器本地（断网状态下也能运行）运行一个小模型，自动识别姓名、银行卡号、邮箱、地址、验证码等敏感信息，并将它们替换为乱码或占位符。
2.云端翻译 (Cloud Translation)：发送给 AI 厂商（如 OpenAI/DeepL）的，是一份“被打码”的文本。AI 模型只能看到上下文结构，绝对看不到你的真实数据。
3.本地还原 (Local Reconstruction)：翻译结果返回后，插件在本地再把原来的敏感信息“填”回去，生成完整的译文。