python导入txt数据-生成词频+词云图

作者：qq632280928 发布时间：2023-5-29 21:00:22

之前做的爬虫，用到了词频分析+词云图现在代码分享给大家
导入txt数据，生成词频+词云图
如果词云图乱码就是缺少这个字体
[color=]'E:/msyh.ttc' 这个字体文件需要下载自己百度下载就行
[color=]效果图

微信图片_20230529160337.png (240.86 KB, 下载次数: 0)
下载附件
2023-5-29 16:04 上传

[color=]下面是代码
[Python] 纯文本查看复制代码# 导入所需库
import jieba
import wordcloud
from collections import Counter
import matplotlib.pyplot as plt
# 读取txt文档
with open('E:/甄嬛传.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 使用jieba进行分词
words = jieba.cut(text)
# 统计词频
word_count = Counter()
for word in words:
if len(word) >= 2:  # 仅统计长度大于等于2的词语
word_count[word] += 1
# 获取词频前100的词汇
top100_words = word_count.most_common(100)
# 输出结果到txt文档
with open('甄嬛传词频.txt', 'w', encoding='utf-8-sig') as f:
for word, count in top100_words:
      f.write(f'{word}: {count}\n')
# 生成词云图
wc = wordcloud.WordCloud(
width=800, height=600, background_color='white',
font_path='E:/msyh.ttc'  # 使用微软雅黑字体
)
wc.generate_from_frequencies(word_count)
plt.imshow(wc, interpolation='bilinear')
plt.axis('off')
plt.show()
# 导出词云图
wc.to_file('甄嬛传词云图.png')

词频, 云图

python导入txt数据-生成词频+词云图

相关帖子

热门主题

新网代注册域名 39元一个需要的联系

logo修改很贵啊

阿里云，腾讯云，各种云，多可以帮忙实名@y

流量越来越少，收益越来越少

GPT Pro、Claude Code、Gemini Pro 对比下

怎么搞一个内地外的手机号绑定大陆 kyc 的

做了个给电商卖家用的商品图工具（Sellshot

求个大佬, 有偿解决, 企业微信自建应用设置

求一些过来人的经验，关于央企里面要不要“

如何开一家中转站，中转站乱相百态，掺水、

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

python导入txt数据-生成词频+词云图

相关帖子

热门主题

新网代注册域名 39元一个 需要的联系

logo修改很贵啊

阿里云，腾讯云，各种云，多可以帮忙实名@y

流量越来越少，收益越来越少

GPT Pro、Claude Code、Gemini Pro 对比下

怎么搞一个内地外的手机号绑定大陆 kyc 的

做了个给电商卖家用的商品图工具（Sellshot

求个大佬, 有偿解决, 企业微信自建应用设置

求一些过来人的经验，关于央企里面要不要“

如何开一家中转站，中转站乱相百态，掺水、

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

新网代注册域名 39元一个需要的联系

在 Yoo趣儿投放广告