链载Ai

标题: 断网条件下使用本机AI助手软件实现Excel表格转换为机器可理解的Markdown格式 [打印本页]

作者: 链载Ai    时间: 6 天前
标题: 断网条件下使用本机AI助手软件实现Excel表格转换为机器可理解的Markdown格式

在不调用 MCP(Model Context Protocol)服务器或任何外部工具(如 Python 脚本、Azure 服务等)的情况下,仅通过Prompt 工程来完成 Excel 到 Markdown 的转换,需要选择具备强大视觉理解(Vision)能力的多模态大语言模型(Multimodal LLM, MLLM)。不调用MCP工具的原因也是害怕把敏感数据通过调用现成的MCP线上服务而泄露出去。而转换中必须用到的本地多模态大语言模型可使用本地Ollama或者LM Studio等工具拉起Qwen-VL或者GLM-4.1V等视觉本地模型以供使用。

这类模型能够“看到”你上传的 Excel 文件(或其截图),理解其中的表格结构(行列、合并单元格、表头等),并根据你的指令将其“翻译”成 Markdown 语法。


以下是具体的模型类型选择、推荐及使用技巧:

1. 核心选择:多模态大语言模型 (MLLM)

仅靠纯文本模型(如 DeepSeek v3.2)是无法处理 Excel 文件的,因为它们只能理解文字。你必须使用支持 **图像输入** 的模型(即:模型具备vision功能)。

推荐的模型:


2. 实现方法:如何通过 Prompt 实现转换

由于不能调用 MCP 或代码解释器,整个过程依赖于“视觉问答(VQA)”模式:

在Cherry Studio软件中新建一个用于转换的名为“表格转为MD”的助手,在模型选择“GLM-4.1V-9B-Thinking”,而选择这个稍微有点过时的模型是因为在硅基流动中,它是免费的。当然,本地电脑配置很高的同学可以使用Ollama调用本地视觉模型,如Qwen3-VL-8B等。

为了演示方便,我们先上硅基流动官网去选一个免费的“视觉”模型:

这里我选中了9B大小的“THUDM/GLM-4.1V-9B-Thinking”免费“视觉”模型。

回到Cherry Studio中,在“模型服务”中找到“硅基流动”,点击右下角的“添加”按钮,在模型名称栏里填入“THUDM/GLM-4.1V-9B-Thinking”。

回到Cherry Studio助手页面,选择”添加助手“。因为仅打算做个简单的用提示词就能使用的对话模式调用大模型,所以选择”添加助手“即可。如果要实现其他复杂功能,就建议”添加Agent“。

编辑新添加的助手,首先”提示词设置“,输入助手的”名称“为:”表格与MD互转“。在提示词框中输入提示词(如下所列)。

在”模型设置“页面选择默认模型为“THUDM/GLM-4.1V-9B-Thinking”。

1. 上传文件/图片:在聊天界面直接上传 Excel 文件(如果平台支持解析)或上传 **Excel 表格区域的截图**。

2. 编写精准 Prompt:告诉模型你的任务。

推荐的 Prompt 提示词:

你可以使用以下结构的 Prompt 来获得最佳效果:

**Prompt 指令:**你是一个专业的数据格式转换助手。 请仔细分析我上传的 Excel 表格图片/文件,严格按照以下要求执行:
1.**识别内容**:准确识别表格中的所有数据,包括表头、行标题和数值。2.**转换格式**:将识别到的表格转换为标准的**Markdown 表格格式**。3.**格式要求**: - 第一行是表头,用`|`分隔。 - 第二行是分隔符,例如`| --- | --- |`。 - 确保行列对齐,不要遗漏任何数据。 - 如果遇到合并单元格,用相应的 Markdown 语法(如跨列用多个空单元格示意或标注)处理,或者在无法实现时在该单元格内注明“合并单元格:XXX”。
请直接输出 Markdown 代码,不要包含其他解释。

为此,我打算在电脑本地的Cherry Studio客户端上本地实现这个功能。

选取一个测试用表格《员工培训名单.xlsx》,如下图所示:

在Cherry Studio的”表格Excel“助手对话框中输入执行命令:

“将上传的文件转换为Markdown格式输出”

在助手对话框中,点击”附件“上传按钮,选中”员工培训名单“Excel表格。点击”执行“即可得到执行结果如下:

除了把原表格中的”办公地点(城市)“给识别裂开在不同列中以外,其他识别都是准确的。然后在不调用MCP工具的前提下,只有自己手工点击左下角的”复制“按钮,然后到Markdown编辑器Obsidian中去创建一个新文件并粘贴复制的内容,如下:

3. 局限性与挑战

仅通过 Prompt 转换(不借助专门的解析工具),你可能会遇到以下问题,需要在 Prompt 中特别强调或后期人工校验:


做到这里,肯定有人会说:”现在网上的免费豆包、千问、元宝等大模型工具完全能实现把Excel表格转换成Markdown格式,何必这么费劲在Cherry Studio客户端上自己用提示词手工处理呢?“

可你有没有想过,不是所有的表格数据都适合放到网上大庭广众之下去做分析提取的,上传数据导致泄密的事件还少吗?所以还是在自己的客户端上来进行数据分析更加靠谱。

最后,再说回到为啥必须要把Excel表格转换成Markdown格式呢?虽然很多AI知识库软件都已经能识别Excel表格数据,但识别的质量有高有低,在咱这儿尽量使用免费工具的垃圾佬看来,还是把Excel表格信息转换成AI识别最为精准的Markdown格式最为靠谱,这样可以极大的提升自建AI知识库的识别精准度。


【全文完】






欢迎光临 链载Ai (http://www.lianzai.com/) Powered by Discuz! X3.5