数据分析--pandas DataFrame

Posted taohongfei

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析--pandas DataFrame相关的知识,希望对你有一定的参考价值。

pandas DataFrame是一个表格类型的数据,含有一组有序的列,每列可以是不同的值类型(数值,字符串,布尔值)。DataFrame即有行索引,也有列索引,可以看作由Series组成的字典(公用同一个索引)。

DataFrame是以一个或者多个二维块存放的(而不是列表,字典或别的一维数据结构)

 

构建DataFrame

传入一个等长列表或Numpy数组组成的字典

 DataFrame会自动加上索引,且全部列会被有序排列

技术分享图片

 

可以指定序列的排序

技术分享图片

传入的列在数据中找不到,会产生Na值

技术分享图片

 

从DataFrame中获取Series---类似字典的方式,返回与DataFrame一样的索引

技术分享图片

给列赋值---注意长度必须跟DataFrame的长度相匹配

技术分享图片

 

若赋值的是一个Series,会精确匹配DataFrame的索引,所有的空为会填上缺失值

技术分享图片

 

 

注意:

  通过索引返回的数据只是相应数据的视图而已,并不是副本。因此,对返回的Series做的任何修改会反应到源DataFrame上

 

嵌套指点---字典的字典

 

  外层字典的键作为列,内层键作为行索引

技术分享图片

 

 也可以对结果进行转置

技术分享图片

 

以上是关于数据分析--pandas DataFrame的主要内容,如果未能解决你的问题,请参考以下文章

pandas改变dataframe索引数据列的数据类型(change the index column data type of pandas dataframe)

pandas 学习: pandas 数据结构之DataFrame

pandas使用字典列表创建dataframe(list of dictionaries)pandas使用字典数据创建dataframe(dictionary)

利用Python进行数据分析:Pandas(Series+DataFrame)

pandas筛选dataframe数据:获取dataframe的第二行到第N行的数据

pandas中DataFrame