博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【词云】代码
阅读量:4568 次
发布时间:2019-06-08

本文共 1230 字,大约阅读时间需要 4 分钟。

1 import sys 2 reload(sys) 3 sys.setdefaultencoding('utf-8') 4  5 from os import path 6 from PIL import Image 7 import numpy as np 8 import matplotlib.pyplot as plt 9 10 from wordcloud import WordCloud11 import jieba12 d = path.dirname(__file__)13 14 stopWordFile = u'stopwords.txt'15 stopWordList = []16 for L in open(path.join(d , stopWordFile)).readlines():17     stopWordList.append(L.strip().decode('utf-8'))18 stopWordList = set(stopWordList)19 20 new = 'words.txt'21 22 text = open(path.join( d , new )).read().strip('\r')23 wordDict = {}24 for w in jieba.cut(text):25     if w not in stopWordList:26         wordDict.setdefault(w , 0)27         wordDict[w] += 128     29 maskImg = 'china.jpeg'30 alice_mask = np.array( Image.open(path.join(d , maskImg)))31 32 wc = WordCloud(background_color = 'white', max_words = 2000 , mask = alice_mask ,33                font_path = path.join(d , 'msyh.ttf'))34 wc.generate_from_frequencies(wordDict)35 36 wc.to_file(path.join(d, "example.png"))37 38 # show39 plt.imshow(wc, interpolation='bilinear')40 plt.axis("off")41 plt.figure()42 plt.imshow(alice_mask, cmap=plt.cm.gray, interpolation='bilinear')43 plt.axis("off")44 plt.show()

 

转载于:https://www.cnblogs.com/colipso/p/6836037.html

你可能感兴趣的文章
js数组,在遍历中删除元素(用 for (var i in arr)是无效的 )
查看>>
通过前端上传图片等文件的方法
查看>>
在 OC 中调用 Swift 代码
查看>>
Android仿腾讯应用宝 应用市场,下载界面, 有了进展button
查看>>
安卓|五大逆向软件下载
查看>>
5 OK6410裸机调试(不用Jlink)
查看>>
“模板”学习笔记(5)-----编译器在处理函数模板的时候都干了啥
查看>>
教你用shell写CGI程序
查看>>
窗口 对话框 Pop Dialog 示例
查看>>
ubuntu(centos) server安装vmware tools
查看>>
数据结构之最大不重复串
查看>>
为什么要配置sdk-tools/platform-toools?
查看>>
自己动手开发更好用的markdown编辑器-07(扩展语法)
查看>>
maven dependency:tree中反斜杠的含义
查看>>
队列的循环队列
查看>>
程序中的日期格式
查看>>
大众点评CAT错误总结以及解决思路
查看>>
从0开始学爬虫3之xpath的介绍和使用
查看>>
Shell成长之路
查看>>
vim下正则表达式的非贪婪匹配
查看>>