python第七周,二维数据的格式化和处理
Posted 某在斯的博客
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python第七周,二维数据的格式化和处理相关的知识,希望对你有一定的参考价值。
二维数据的表示:
类表类型可以表示二维数据
[ [424,23423,2342],[131,535,3646] ]
使用两层for循环可以便利每个元素
外层列表中每个元素可以对应一行,也可以对应一列
一维数据分为列表和集合类型,二维数据只有列表类型
CSV数据存储格式
国际通用的一二维数据存储格式,一般.csv扩展名,每行一个一维数据,采用逗号分隔,无空行
Excel软件可读入输出,一般编辑软件都可以产生,如果某个元素缺失,逗号仍要保留,
二维数据的表头可以作为数据存储,也可以另行存储,
一般索引习惯,ls[row][cokumn],先行后列
二维数据的处理:
从CSV格式的文件中读入数据
fo = open(fname)
ls = []
for line in fo:
line = line.replace("
","")
ls.append(line.split(","))
fo.close()
二维数据的写入处理
ls = [[],[],[]]
f = open (fname,‘w‘)
for item in ls:
f.write(‘,‘.join(item) + ‘
‘)
f.close()
二维数据的逐一处理:
ls = [[],[],[]]
for row in ls:
for column in row:
print(ls[row][column])
wordcloud库的使用:
cmd 命令行:pip install wordcloud
wordcloud.WordCloud()代表一个文本对应的词云
wordcloud库常规方法
w=wordcloud.WordCloud()
方法 | 描述 |
w.generate(txt) |
向对象w中加载文本txt, >>>w.generate("afwawfawf") |
w.to_file(filename) |
将词云输出为图像文件,.png或.jpg >>>w.to_file("outfile.png") |
配置对象参数:
参数 | 描述 |
width |
指定词云对象生成图片的宽度,默认400像素 >>>w = wordcloud.WordCloud(width=600) |
height | 高度,默认200 |
min_font_size | 指定词云中字体的最小字号,默认4号 |
max_font_size | 最大字号,根据高度自动调节 |
fount_step | 指定词云中字体字号的步进间隔默认为1 |
fount_path |
指定字体文件的路径,默认None >>>w =wordcloud.WordCloud(font_path="msyh.ttc") |
max_words | 指定词云最大单词数量,默认20 |
stop_words | 指定词云的排除词列表, |
mask |
指定词云形状,默认为长方形,需要引用imread()函数 >>>from scipy.misc import imread >>>mk = imread("pic.png") >>>w = wordcloud.WordCloud(mask=mk) |
background_color | 指定词云图片的背景颜色,默认为黑色 |
以上是关于python第七周,二维数据的格式化和处理的主要内容,如果未能解决你的问题,请参考以下文章