断网条件下使用本机AI助手软件实现Excel表格转换为机器可理解的Markdown格式

显示全部楼层

在不调用 MCP（Model Context Protocol）服务器或任何外部工具（如 Python 脚本、Azure 服务等）的情况下，仅通过Prompt 工程来完成 Excel 到 Markdown 的转换，需要选择具备强大视觉理解（Vision）能力的多模态大语言模型（Multimodal LLM, MLLM）。不调用MCP工具的原因也是害怕把敏感数据通过调用现成的MCP线上服务而泄露出去。而转换中必须用到的本地多模态大语言模型可使用本地Ollama或者LM Studio等工具拉起Qwen-VL或者GLM-4.1V等视觉本地模型以供使用。

这类模型能够“看到”你上传的 Excel 文件（或其截图），理解其中的表格结构（行列、合并单元格、表头等），并根据你的指令将其“翻译”成 Markdown 语法。

以下是具体的模型类型选择、推荐及使用技巧：

1. 核心选择：多模态大语言模型 (MLLM)

仅靠纯文本模型（如 DeepSeek v3.2）是无法处理 Excel 文件的，因为它们只能理解文字。你必须使用支持 **图像输入** 的模型（即：模型具备vision功能）。

推荐的模型:

Qwen-VL系列：目前视觉理解能力最强的梯队之一，对表格结构的解析非常精准，能很好地处理复杂的合并单元格和多级表头。

GLM-4.5V：拥有超长上下文窗口，非常适合处理包含大量数据的 Excel 截图或文件，表格识别能力也很出色。

2. 实现方法：如何通过 Prompt 实现转换

由于不能调用 MCP 或代码解释器，整个过程依赖于“视觉问答（VQA）”模式：

在Cherry Studio软件中新建一个用于转换的名为“表格转为MD”的助手，在模型选择“GLM-4.1V-9B-Thinking”，而选择这个稍微有点过时的模型是因为在硅基流动中，它是免费的。当然，本地电脑配置很高的同学可以使用Ollama调用本地视觉模型，如Qwen3-VL-8B等。

为了演示方便，我们先上硅基流动官网去选一个免费的“视觉”模型：

这里我选中了9B大小的“THUDM/GLM-4.1V-9B-Thinking”免费“视觉”模型。

回到Cherry Studio中，在“模型服务”中找到“硅基流动”，点击右下角的“添加”按钮，在模型名称栏里填入“THUDM/GLM-4.1V-9B-Thinking”。

回到Cherry Studio助手页面，选择”添加助手“。因为仅打算做个简单的用提示词就能使用的对话模式调用大模型，所以选择”添加助手“即可。如果要实现其他复杂功能，就建议”添加Agent“。

编辑新添加的助手，首先”提示词设置“，输入助手的”名称“为：”表格与MD互转“。在提示词框中输入提示词（如下所列）。

在”模型设置“页面选择默认模型为“THUDM/GLM-4.1V-9B-Thinking”。

1. 上传文件/图片：在聊天界面直接上传 Excel 文件（如果平台支持解析）或上传 **Excel 表格区域的截图**。

2. 编写精准 Prompt：告诉模型你的任务。

推荐的 Prompt 提示词：

你可以使用以下结构的 Prompt 来获得最佳效果：

**Prompt 指令：**你是一个专业的数据格式转换助手。 请仔细分析我上传的 Excel 表格图片/文件，严格按照以下要求执行：
1.**识别内容**：准确识别表格中的所有数据，包括表头、行标题和数值。2.**转换格式**：将识别到的表格转换为标准的**Markdown 表格格式**。3.**格式要求**：  - 第一行是表头，用`|`分隔。  - 第二行是分隔符，例如`| --- | --- |`。  - 确保行列对齐，不要遗漏任何数据。  - 如果遇到合并单元格，用相应的 Markdown 语法（如跨列用多个空单元格示意或标注）处理，或者在无法实现时在该单元格内注明“合并单元格：XXX”。
请直接输出 Markdown 代码，不要包含其他解释。

为此，我打算在电脑本地的Cherry Studio客户端上本地实现这个功能。

选取一个测试用表格《员工培训名单.xlsx》，如下图所示：

在Cherry Studio的”表格Excel“助手对话框中输入执行命令：

“将上传的文件转换为Markdown格式输出”

在助手对话框中，点击”附件“上传按钮，选中”员工培训名单“Excel表格。点击”执行“即可得到执行结果如下：

除了把原表格中的”办公地点（城市）“给识别裂开在不同列中以外，其他识别都是准确的。然后在不调用MCP工具的前提下，只有自己手工点击左下角的”复制“按钮，然后到Markdown编辑器Obsidian中去创建一个新文件并粘贴复制的内容，如下：

3. 局限性与挑战

仅通过 Prompt 转换（不借助专门的解析工具），你可能会遇到以下问题，需要在 Prompt 中特别强调或后期人工校验：

合并单元格（Merged Cells）：这是 Excel 转 Markdown 最大的痛点。Markdown 原生不支持复杂的行列合并。模型可能会将其展平或留空，需要检查数据是否错位。

长表格截断：如果表格非常长，模型可能会因为上下文窗口限制或视觉注意力分散而截断输出。对于长表格，建议分页截图上传。（这个得后续专门验证一下，一般来说模型上下文窗口越长，能一次性识别的数据量越大。）

数据精度：对于包含大量数字的财务表格，模型偶尔可能会看错行或看错列，建议对关键数据进行抽样核对。

做到这里，肯定有人会说：”现在网上的免费豆包、千问、元宝等大模型工具完全能实现把Excel表格转换成Markdown格式，何必这么费劲在Cherry Studio客户端上自己用提示词手工处理呢？“

可你有没有想过，不是所有的表格数据都适合放到网上大庭广众之下去做分析提取的，上传数据导致泄密的事件还少吗？所以还是在自己的客户端上来进行数据分析更加靠谱。

最后，再说回到为啥必须要把Excel表格转换成Markdown格式呢？虽然很多AI知识库软件都已经能识别Excel表格数据，但识别的质量有高有低，在咱这儿尽量使用免费工具的垃圾佬看来，还是把Excel表格信息转换成AI识别最为精准的Markdown格式最为靠谱，这样可以极大的提升自建AI知识库的识别精准度。

【全文完】