数据分析--pandas DataFrame
Posted taohongfei
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析--pandas DataFrame相关的知识,希望对你有一定的参考价值。
pandas DataFrame是一个表格类型的数据,含有一组有序的列,每列可以是不同的值类型(数值,字符串,布尔值)。DataFrame即有行索引,也有列索引,可以看作由Series组成的字典(公用同一个索引)。
DataFrame是以一个或者多个二维块存放的(而不是列表,字典或别的一维数据结构)
构建DataFrame
传入一个等长列表或Numpy数组组成的字典
DataFrame会自动加上索引,且全部列会被有序排列
可以指定序列的排序
传入的列在数据中找不到,会产生Na值
从DataFrame中获取Series---类似字典的方式,返回与DataFrame一样的索引
给列赋值---注意长度必须跟DataFrame的长度相匹配
若赋值的是一个Series,会精确匹配DataFrame的索引,所有的空为会填上缺失值
注意:
通过索引返回的数据只是相应数据的视图而已,并不是副本。因此,对返回的Series做的任何修改会反应到源DataFrame上
嵌套指点---字典的字典
外层字典的键作为列,内层键作为行索引
也可以对结果进行转置
以上是关于数据分析--pandas DataFrame的主要内容,如果未能解决你的问题,请参考以下文章
007.PGSQL-python读取txt文件,将数据转化为dataFrame,dataFrame数据插入到pgsql; dataframe去掉索引,指定列为索引;python读取pgsql数据,读取
pandas筛选dataframe数据:获取dataframe的第二行到第N行的数据
pandas构建复合索引数据(multiple index dataframe)pandas索引复合索引dataframe数据