|
在不调用 MCP(Model Context Protocol)服务器或任何外部工具(如 Python 脚本、Azure 服务等)的情况下,仅通过Prompt 工程来完成 Excel 到 Markdown 的转换,需要选择具备强大视觉理解(Vision)能力的多模态大语言模型(Multimodal LLM, MLLM)。不调用MCP工具的原因也是害怕把敏感数据通过调用现成的MCP线上服务而泄露出去。而转换中必须用到的本地多模态大语言模型可使用本地Ollama或者LM Studio等工具拉起Qwen-VL或者GLM-4.1V等视觉本地模型以供使用。 这类模型能够“看到”你上传的 Excel 文件(或其截图),理解其中的表格结构(行列、合并单元格、表头等),并根据你的指令将其“翻译”成 Markdown 语法。
以下是具体的模型类型选择、推荐及使用技巧: 1. 核心选择:多模态大语言模型 (MLLM) 仅靠纯文本模型(如 DeepSeek v3.2)是无法处理 Excel 文件的,因为它们只能理解文字。你必须使用支持 **图像输入** 的模型(即:模型具备vision功能)。 推荐的模型:
2. 实现方法:如何通过 Prompt 实现转换 由于不能调用 MCP 或代码解释器,整个过程依赖于“视觉问答(VQA)”模式: 在Cherry Studio软件中新建一个用于转换的名为“表格转为MD”的助手,在模型选择“GLM-4.1V-9B-Thinking”,而选择这个稍微有点过时的模型是因为在硅基流动中,它是免费的。当然,本地电脑配置很高的同学可以使用Ollama调用本地视觉模型,如Qwen3-VL-8B等。 为了演示方便,我们先上硅基流动官网去选一个免费的“视觉”模型:这里我选中了9B大小的“THUDM/GLM-4.1V-9B-Thinking”免费“视觉”模型。 回到Cherry Studio中,在“模型服务”中找到“硅基流动”,点击右下角的“添加”按钮,在模型名称栏里填入“THUDM/GLM-4.1V-9B-Thinking”。 回到Cherry Studio助手页面,选择”添加助手“。因为仅打算做个简单的用提示词就能使用的对话模式调用大模型,所以选择”添加助手“即可。如果要实现其他复杂功能,就建议”添加Agent“。 编辑新添加的助手,首先”提示词设置“,输入助手的”名称“为:”表格与MD互转“。在提示词框中输入提示词(如下所列)。 在”模型设置“页面选择默认模型为“THUDM/GLM-4.1V-9B-Thinking”。 1. 上传文件/图片:在聊天界面直接上传 Excel 文件(如果平台支持解析)或上传 **Excel 表格区域的截图**。 2. 编写精准 Prompt:告诉模型你的任务。 推荐的 Prompt 提示词: 你可以使用以下结构的 Prompt 来获得最佳效果: **Prompt 指令:**你是一个专业的数据格式转换助手。 请仔细分析我上传的 Excel 表格图片/文件,严格按照以下要求执行:
1.**识别内容**:准确识别表格中的所有数据,包括表头、行标题和数值。2.**转换格式**:将识别到的表格转换为标准的**Markdown 表格格式**。3.**格式要求**: - 第一行是表头,用`|`分隔。 - 第二行是分隔符,例如`| --- | --- |`。 - 确保行列对齐,不要遗漏任何数据。 - 如果遇到合并单元格,用相应的 Markdown 语法(如跨列用多个空单元格示意或标注)处理,或者在无法实现时在该单元格内注明“合并单元格:XXX”。
请直接输出 Markdown 代码,不要包含其他解释。
为此,我打算在电脑本地的Cherry Studio客户端上本地实现这个功能。 选取一个测试用表格《员工培训名单.xlsx》,如下图所示: 在Cherry Studio的”表格Excel“助手对话框中输入执行命令: “将上传的文件转换为Markdown格式输出” 在助手对话框中,点击”附件“上传按钮,选中”员工培训名单“Excel表格。点击”执行“即可得到执行结果如下: 除了把原表格中的”办公地点(城市)“给识别裂开在不同列中以外,其他识别都是准确的。然后在不调用MCP工具的前提下,只有自己手工点击左下角的”复制“按钮,然后到Markdown编辑器Obsidian中去创建一个新文件并粘贴复制的内容,如下: 3. 局限性与挑战 仅通过 Prompt 转换(不借助专门的解析工具),你可能会遇到以下问题,需要在 Prompt 中特别强调或后期人工校验:
做到这里,肯定有人会说:”现在网上的免费豆包、千问、元宝等大模型工具完全能实现把Excel表格转换成Markdown格式,何必这么费劲在Cherry Studio客户端上自己用提示词手工处理呢?“ 可你有没有想过,不是所有的表格数据都适合放到网上大庭广众之下去做分析提取的,上传数据导致泄密的事件还少吗?所以还是在自己的客户端上来进行数据分析更加靠谱。 最后,再说回到为啥必须要把Excel表格转换成Markdown格式呢?虽然很多AI知识库软件都已经能识别Excel表格数据,但识别的质量有高有低,在咱这儿尽量使用免费工具的垃圾佬看来,还是把Excel表格信息转换成AI识别最为精准的Markdown格式最为靠谱,这样可以极大的提升自建AI知识库的识别精准度。
【全文完】 |