先放个结果图:
阴阳师某微博评论
需要用的库:
from wordcloud import WordCloud
import jieba
import matplotlib.pyplot as plt
首先我们要准备一段文字,比如爬到的微博评论
阴阳师某条微博下面的评论
使用jieba库将文字内容进行切分
text = " ".join(jieba.cut(text))
得到
切分之后的文本
然后使用wordcloud生成词云。
在生成中文词云的时候,需要指定一个字体,否则会输出一堆方块。
选择任意一个需要的字体,放在当前文件目录下,我用的是simhei.ttf,然后执行代码:
wordcloud = WordCloud(background_color="white",font_path="simhei.ttf",
max_font_size=100,max_words=300,width=1000,height=800).generate(text)
plt.figure(figsize=((10, 8)))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
就可以得到词云了
参考:
python爬虫爬取微博评论案例详解
# Python爬虫实例学习篇——5、【超详细记录】从爬取微博评论数据(免登陆)到生成词云














网友评论