Pandas
Posted shareinfo
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas相关的知识,希望对你有一定的参考价值。
Pandas是基于Numpy构建的库,在数据处理方面可以把它理解为numpy加强版,同时Pandas也是一项开源项目 。不同于numpy的是,pandas拥有种数据结构:Series和DataFrame:
Series是一种类似一维数组的数据结构,由一组数据和与之相关的index组成,这个结构一看似乎与dict字典差不多,我们知道字典是一种无序的数据结构,而pandas中的Series的数据结构不一样,它相当于定长有序的字典,并且它的index和value之间是独立的,两者的索引还是有区别的,Series的index是可变的,而dict字典的key值是不可变的。
Series的生成方式:
1 #没有指定index,生成默认的index 2 data = Series([9527,‘btch‘,2345,‘efos‘]) 3 #指定index 4 data = Series([9,5,2,7],index = [‘aa‘,‘bb‘,‘cc‘,‘dd‘])
DataFrame这种数据结构我们可以把它看作是一张二维表,DataFrame长得跟我们平时使用的Excel表格差不多,DataFrame的横行称为columns,竖列和Series一样称为index,DataFrame每一列可以是不同类型的值集合,所以DataFrame你也可以把它视为不同数据类型同一index的Series集合。
DataFrame的生成与Series差不多,你可以自己指定index,也可不指定,DataFrame会自动帮你补上。
#Series的两种生成方式
以上是关于Pandas的主要内容,如果未能解决你的问题,请参考以下文章
text [检查特定的数据片段]取自论文但有意思应用。 #python #pandas