DataFrame查询2 - 专用查询:索引和切片
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了DataFrame查询2 - 专用查询:索引和切片相关的知识,希望对你有一定的参考价值。
参考技术A 经过优化,推荐三种查询方式:
参数书写顺序都是都是先行后列
用于不连续(行列有间隔)行列区块查询
查询单行
查询多行
查询单列
查询多列
查询一行多列
查询多行1列
查询1行1列(单元格)
查询多行多列交叉(多个单元格)
用于查询连续的行列区块
查询单行单列
查询多行多列(连续)
切片步长和倒查
索引查询可以实现切片查询的所有功能,只是有个书写效率问题
Pandas - 索引操作
参考技术A 读取数据集:选取指定的列:选取 DataFrame 的 Age 列。
选取指定的多个列,使用列表索引传入多个列的名称即可:
选取 DataFrame 的 Name 列和 Age 列:
选取 DataFrame 的指定行,有如下两种方式:
选取第一行数据:
使用位置切片,选取前五行内容:
使用位置切片,选取前五行内容的第二列和第三列内容:
首先,为 DataFrame 设置标签索引:将 Name 列设置为索引:
选取标签索引为 'Wirz, Mr. Albert' 的行:
使用标签切片选取指定的 DataFrame 行和列:
df['Fare'] > 30 将返回一个布尔类型的 Series :
该布尔类型的 Series 可以作为布尔索引传入 DataFrame :
选取所有 Fare 列大于 30 的 DataFrame 行:
布尔索引也可以配合标签索引,选取指定的 DatFrame 区域:
此外,调用布尔型 Series 的 sum 方法可以获取满足该布尔条件的记录数量:
以上是关于DataFrame查询2 - 专用查询:索引和切片的主要内容,如果未能解决你的问题,请参考以下文章
pandas 对数据帧DataFrame中数据的索引及切片操作
使用 ix() 方法对带有负索引的 pandas DataFrame 进行切片
数据分析2 numpy(ndarray数组,属性,创建,索引切片,运算,函数,随机数), Pandas(Series创建,缺失值处理,特性,索引,DataFrame)