返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

AI数据分析:用kimi批量根据word文档生成词云图片

[复制链接]
链载Ai 显示全部楼层 发表于 9 小时前 |阅读模式 打印 上一主题 下一主题

ingFang SC", "Microsoft YaHei", "Source Han Sans SC", "Noto Sans CJK SC", "WenQuanYi Micro Hei", sans-serif;font-size: medium;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">在kimi中输入提示词:

ingFang SC", "Microsoft YaHei", "Source Han Sans SC", "Noto Sans CJK SC", "WenQuanYi Micro Hei", sans-serif;font-size: medium;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">你是一个Python编程专家,完成如下Python脚本的编写:

ingFang SC", "Microsoft YaHei", "Source Han Sans SC", "Noto Sans CJK SC", "WenQuanYi Micro Hei", sans-serif;font-size: medium;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">读取"F:\AI.docx"这个文件;

ingFang SC", "Microsoft YaHei", "Source Han Sans SC", "Noto Sans CJK SC", "WenQuanYi Micro Hei", sans-serif;font-size: medium;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">然后用jieba分词对文件内容进行分词;

ingFang SC", "Microsoft YaHei", "Source Han Sans SC", "Noto Sans CJK SC", "WenQuanYi Micro Hei", sans-serif;font-size: medium;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">用wordcloud生成词云,背景颜色设为白色;

ingFang SC", "Microsoft YaHei", "Source Han Sans SC", "Noto Sans CJK SC", "WenQuanYi Micro Hei", sans-serif;font-size: medium;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">词云图片保存到F盘;

ingFang SC", "Microsoft YaHei", "Source Han Sans SC", "Noto Sans CJK SC", "WenQuanYi Micro Hei", sans-serif;font-size: medium;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">注意:每一步都要输出相关信息到屏幕上

ingFang SC", "Microsoft YaHei", "Source Han Sans SC", "Noto Sans CJK SC", "WenQuanYi Micro Hei", sans-serif;font-size: medium;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">指定使用Windows系统中的黑体字体 ,字体路径为:'C:\\Windows\\Fonts\\simsun.ttc'

ingFang SC", "Microsoft YaHei", "Source Han Sans SC", "Noto Sans CJK SC", "WenQuanYi Micro Hei", sans-serif;font-size: medium;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">

ingFang SC", "Microsoft YaHei", "Source Han Sans SC", "Noto Sans CJK SC", "WenQuanYi Micro Hei", sans-serif;font-size: medium;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">为什么要指定字体呢?

如果不指定字体,词云中的英文显示正常,但是中文是乱码的。生成词云时中文显示为乱码通常是因为字体问题。wordcloud库默认使用的字体可能不支持中文字符,因此需要指定一个支持中文的字体。在Python中,一个常用的支持中文的字体是'SimHei'(黑体)。要解决这个问题,需要做两件事:指定中文字体:在创建WordCloud对象时,设置font_path参数为一个支持中文的字体路径。安装中文字体:如果你的系统中没有安装支持中文的字体,你需要先安装一个。

Kim生成的Python源代码:

import os

from docx import Document

from wordcloud import WordCloud

import jieba

from PIL import Image

import numpy as np

# 设置文件路径和字体路径

docx_path = 'F:\\AI.docx'

output_image_path = 'F:\\wordcloud.png'

font_path = 'C:\\Windows\\Fonts\\simsun.ttc' # 指定Windows系统中的黑体字体路径

# 检查文件是否存在

if not os.path.isfile(docx_path):

print(f'文件 {docx_path} 不存在。')

else:

# 读取Word文档

doc = Document(docx_path)

text = " ".join([para.text for para in doc.paragraphs])

print('文件读取成功。')

# 使用jieba进行中文分词

words = " ".join(jieba.cut(text, cut_all=False))

print('分词完成。')

# 生成词云

wordcloud = WordCloud(

font_path=font_path, # 指定中文字体路径

background_color='white',

max_words=200,

max_font_size=100,

random_state=42,

width=800,

height=400,

colormap='viridis'

).generate(words)

# 保存词云图片

wordcloud.to_file(output_image_path)

print(f'词云图片已保存到 {output_image_path}')

# 显示词云图片

image = Image.open(output_image_path)

image.show()

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ