在这个互联网时代,我们每天的工作都离不开大量的英文阅览,不论是看 GitHub 上的技术文档,或是 arXiv 上的最新论文,以及一些外文 PDF 文档和偏英文语言显示的社交网站。
这个时候有个好用的翻译工具尤为重要!这就不得不提到在 AI 元年横空出世的全能翻译工具:「沉浸式翻译」。
它是一款基于 AI 驱动的跨平台在线翻译工具,提供网页、文档、视频等内容的实时双语对照翻译体验。
我们通过它可以免费即时翻译外语网页、PDF文档、ePub电子书、字幕文件、在线视频字幕、图片等内容,并以原文+译文对照形式呈现。
主要功能有网页翻译(沉浸式阅读)、鼠标悬停翻译、输入框翻译、文档翻译、在线视频字幕翻译、会议翻译、图片翻译、漫画翻译等。
目前主流的使用方式是通过浏览器插件的形式,适⽤于Chrome、Edge、Firefox、Safari等主流浏览器。安装后浏览任意外语⽹⻚即可启⽤翻译功能。即使不注册不登录也可以使用其提供的免费 AI 模型进行翻译。
从2023年横空出世,到狂揽全球1000万+用户,再到2024年底斩获Google Chrome 网上应用商店年度精选扩展程序殊荣,它几乎凭一己之力改变了我们阅读外语信息的习惯。
但今天,想说的是它最新推出的两个核弹级的功能:专治PDF排版乱码的「BabelDoc」和首个开源本地AI隐私防火墙「OneAIFW」。
更令人震惊的是——他们把这两个核心技术都开源了!
无论你是被英文文献折磨的科研党,还是担心机密泄露的职场人,这篇文章你一定要看完。这不仅仅是工具的迭代,更是AI翻译体验的一次降维打击。
在PDF翻译场景中,传统机器翻译⼯具往往⾯临在“精准翻译”与“排版保全”之间难以两全的问题。而面临的后果就是: 数学公式逻辑断裂、复杂的图文排版错位、原始版式严重⾛样,阅读体验极差,甚至因为格式混乱导致理解偏差。
沉浸式翻译团队显然也深入调研了这些用户痛点,于是他们推出了专为PDF场景打造的全新 AI 翻译工具:BabelDoc。
BabelDoc 是沉浸式翻译团队专门针对 PDF 场景研发的全新 AI 翻译引擎。
目前 BabelDoc 处于Beta 阶段,所有⽤⼾都可以直接使⽤。
大家在浏览器中安装好「沉浸式翻译」插件后,点击插件图标->选择最下方的「更多」->选择「BabelDoc PDF 翻译」即可跳转 BabelDoc 翻译页面。
当然也可以直接访问下面的地址直接使用 BabelDoc 功能。
https://app.immersivetranslate.com/babel-doc
光说不练假把式。为了验证 BabelDoc 的真实实力,我找了三种最容易“翻车”的 PDF 文档进行了实测。
测试样本: arXiv 深度学习论文,包含大量公式。
我们去 arVix 上找到一份包含大量公式的论文,下载为 PDF 后,上传到 BabelDoc 工具页面,模型可以自己指定单个模型或搭配多模型,页面也可以自由指定某一页进行翻译。
等待几分钟,看看实测结果:
可以看出 BabelDoc 完美识别了数学符号及相应的公式。它只翻译“人话”,绝不碰公式。 所有的上下标、推导逻辑纹丝不动。这对科研党来说简直是救命功能。
此外,我也顺便启用了自动提取术语表的功能,点击右上角「下载自动提取的术语表」即可查看PDF中存在的一些术语,可以用来弥补学习我们原有的知识空白。
测试样本: IPhone17 Pro 产品环境报告,包含饼图和嵌入式文字。还有一些复杂图形案例。
从结果上看,饼状图内英文被精准替换为中文,形状位置不变,无损解析,颜色、线条与原版 1:1 复刻。
还有下面的这种文字+图形的场景下,也能正常处理到位。
测试样本: 包含头像、文字、多级标题、多种段落的公开研报。
从实测结果看,通过 BabelDoc 翻译的文档可以精确识别文档结构与段落布局。译文与原文智能对齐,且原文的加粗、颜色标注全部保留,且智能匹配了非常舒适的中文字体,阅读体验极佳。
在 BableDoc 如此优质的翻译服务下,同时它还是开源的产品,目前已经在 GitHub 揽获 7.1K Star!有相应文档翻译需求的个人或团队也可部署在本地或集成在自家的产品上。
开源地址:https://github.com/funstory-ai/BabelDOC
目前 BabelDoc 处于 Beta 阶段,免费版用户每月也有 50 万 Token 额度,足够日常翻译需求了!
在 AI 时代,我们陷入了一个两难境地:想用 Gemini 等强大模型的翻译能力,就必须把数据传到云端;想保护隐私,就只能用由于算力限制而不够智能的本地模型。
为了解决这些安全问题,沉浸式翻译也开源了另一款工具:OneAIFW (One AI Firewall) — 本地 AI 防火墙。
在沉浸式翻译里使用,也可以在不牺牲云端 AI 能⼒的前提下,实现“⽤⼾隐私只留在本地”的安全翻译。
OneAIFW 的定位非常清晰:让“AI 翻译”第一次具备可验证的隐私保护能力。它采用独创的“三段式”脱敏技术:
最让我放心的是,OneAIFW 是基于 MIT 协议开源的。
这意味着它的安全机制是公开透明的,任何开发者都可以去 GitHub 检查代码,确保没有后门。
前置条件:升级沉浸式翻译插件⾄ V1.23.3 或更⾼版本。
启用路径:点击「沉浸式翻译」扩展图标 → 设置 → 进阶设置 → OneAIFW(Beta) → 选择「内置」。
选择内置系统会⾃动启动本地脱敏⼩模型。 如若选择自定义可以自行需求模型路径。启用后平时翻译⽹⻚或⽂档,会全程自动隐私保护。
如果想查看脱敏⽇志记录,可在设置->开发者设置,启⽤ 「在控制台打印调式⽇志」 选项。
后续再使用翻译功能后,打开浏览器控制台 (F12),输入 sensitive 过滤日志,你可以清晰地看到敏感信息被替换为[MASK] 发送的过程。
官方也提供了一个在线的私隐保护演示的站点,可以玩一玩,验证下效果和脱敏流程。
私隐保护演示:https://oneaifw.com
看到这里,相信很多朋友已经跃跃欲试了。。。
在 AI 工具爆发的时代,我们到底需要什么样的翻译工具?
沉浸式翻译交出了一份非常完美的答卷。它不仅仅是一个简单的语言翻译应用,更是一个尊重知识结构、捍卫数据主权的生产力平台。
首先,BabelDoc 解决了“读得懂”的问题。它通过像素级的还原,打破了语言转换带来的格式壁垒。
对于我们这些科研人员、开发者和金融从业者来说,这意味着我们不再需要在“糟糕的排版”和“陌生的语言”之间做妥协。每一次阅读,都是一次原汁原味的知识获取,这种体验的提升是质的飞跃。
其次,OneAIFW 解决了“敢不敢用”的问题。在数字化时代,隐私是最后的奢侈品。沉浸式翻译通过开源本地防火墙,将数据的控制权重新交还给了用户。
这种“本地脱敏+云端智能”的混合架构,或许将成为未来 AI 工具处理敏感数据的标准范式。它让我们在享受 AI 带来的便利时,不再需要以牺牲隐私为代价。
最后,我想说的是,工具的价值在于赋能。无论你是为了啃下那篇晦涩的论文,还是为了快速读懂那份充满图表的财报,亦或是为了安全地处理一份涉密合同,沉浸式翻译都提供了目前最优雅的解法。
BabelDoc 让你读得舒心,OneAIFW 让你用得放心。如果你的浏览器里还没装这个插件,推荐安装起来。
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |