python词云生成教程

   

好像很多人对词云很感兴趣,想要根据自己的聊天记录词频生成出好看的词云生成这个其实很简单,github上面有python代码:地址

环境准备

python3环境的配置这里不再赘述,百度有很多,也可以使用Anaconda安装。
首先,运行下面两条命令安装两个库jiebawordcloud库:

pip3 install jieba
pip3 install wordcloud

代码结构

这个代码文件夹是如下结构:

  • data
    • templates
      这个文件夹下放所有你词云想要的样式图片,背景色最好简单一点。
    • stopwords.txt
      这是停止词文件,对于你不想在词云中出现的词,你都可以添加到这个文件中过滤掉它。
  • fonts
    这个文件夹下放词云中显示的字体。
  • create_word_cloud.py
    这是词云的主代码。
  • preprocess.py
    这是用来预处理QQ聊天记录的。

使用方法

将词条存储在文本文件中,然后运行如下命令即可

python3 create_word_cloud.py filename.txt

如何生成QQ聊天记录词云

首先打开消息记录,点击下方的消息管理,然后在需要导出的聊天对象上面右键点击导出消息记录,保存类型选择txt,点保存,并将文件保存在wordcloud根目录下,然后打开命令行运行python3 preprocess.py filename.txt,用来去掉聊天记录中的昵称和时间等信息,最后运行python3 create_word_cloud.py __filename.txt就能生成词云了。

发表评论