Python 数据处理（二十九）—— MultiIndex 高级索引操作

Posted 2023-04-25

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Python 数据处理（二十九）—— MultiIndex 高级索引操作相关的知识，希望对你有一定的参考价值。

参考技术A

从语法上将 MultiIndex 与 .loc 集成在高级索引中是有些挑战性。通常， MultiIndex 的键采用元组的形式。例如

注意 : 虽然也可以使用 df.loc[\'bar\', \'two\'] ，但这种简写的符号通常会导致歧义

如果你还想用 .loc 索引某一列，你必须像这样使用一个元组

想要获取第一个级别的某一标签的所有元素，并不需要传递元组，例如

而不是使用 df.loc[(\'bar\'，)，] (等价于 df.loc[\'bar\'，] )

当然，也可以进行切片

通过提供一个元组切片，选择范围内的值

传递一个标签或元组列表的工作原理类似于 reindex

需要注意的是，在 pandas 中，当涉及到索引时，元组和列表的处理方式并不相同。

元组被解释为一个多级键，而列表则用来指定多个键。或者换句话说，元组是横向的，列表是纵向的

您可以通过提供多个索引器来对 MultiIndex 进行切片

可以使用 slice(None) 选择该级别的所有内容，没有指定索引的级别默认为 slice(None)

通常，切片的两段都会包括在内，因为这是标签索引

在使用 .loc 的时候，最好同时指定索引（行）和标签（列），因为在某些情况下，传递的索引可能会被解析为两个轴而不是 MultiIndex

你应该使用

而不是

例如

使用切片，列表和标签的基本 MultiIndex 切片操作

你可以使用 pandas.IndexSlice 来让 : 语法显得更自然一些，而不是使用 slice(None)

可以使用这种方法在多个轴同时进行相当复杂的选择

您可以使用布尔索引器来进行与值相关的选择

您还可以为 .loc 指定 axis 参数，以在某一个轴上传递切片

此外，您可以使用以下方法设置这些值

也可以在等号右边使用可对齐对象

DataFrame 的 xs() 方法还接受一个 level 参数，以便更容易在 MultiIndex 的特定级别上选择数据

使用切片

您还可以为 xs 提供 axis 参数来选择列

使用切片

xs 还允许使用多个键进行选择

使用切片

您可以将 drop_level=False 传递给 xs ，以保留所选择的级别

使用 drop_level=True (默认值)与上面的结果比较

在 pandas 对象的 reindex() 和 align() 方法中使用 level 参数，可以在一个级别上广播值

swaplevel() 方法可以切换两个级别的顺序

reorder_levels() 方法是 swaplevel 方法的推广，允许你在一个步骤中排列分层索引级别

rename() 方法可用于重命名 MultiIndex 的标签，通常用于重命名 DataFrame 的列

rename 的 columns 参数允许指定需要重命名的列的字典

这个方法也可以用来重命名 DataFrame 主索引的特定标签

rename_axis() 方法用于重命名 Index 或 MultiIndex 的名称。

特别地，可以指定 MultiIndex 的级别名称，可以使用 reset_index() 将 MultiIndex 移动到列

注意： DataFrame 的列是一个索引，因此使用 rename_axis 和 columns 参数可以改变该索引的名称

rename 和 rename_axis 都支持指定字典、 Series 或映射函数来将标签/名称映射到新值

当直接使用 Index 对象而不是通过 DataFrame 工作时，可以使用 Index.set_names() 来更改名称

您不能通过 level 设置 MultiIndex 的名称

使用 Index.set_names() 替代

python学习（二十九）类方法连接数据库及面向对象编程

1、类方法连接数据库

先说一下析构函数

 def __del__(self):
    pass

析构函数，在实例被销毁的时候执行，那么对于连接数据库，在实例执行后，需要关闭游标和数据库连接，这两个操作就可以放到析构函数里面

import pymysql
class Mydb(object):
    def __del__(self):  #析构函数,实例被销毁的时候执行的
        self.cur.close()
        self.coon.close()
        print(‘over‘)
    def __init__(self,host,user,passwd,db,
                 port=3306,charset=‘utf8‘):
        try:
            self.coon=pymysql.connect(
                     host=host,user=user,passwd=passwd,port=port,
                     charset=charset,db=db,autocommit=True
                     )  #autocommit 自动提交，写语句的时候自动提交
        except Exception as e:
            print(‘数据库连接失败！%s‘%e)
        else:
            self.cur=self.coon.cursor(cursor=pymysql.cursors.DictCursor)

    def exsql(self,sql):
        try:
            self.cur.execute(sql)
        except Exception as e:
            print(‘sql语句有问题,%s‘%sql)
        else:
            self.res=self.cur.fetchall()
            return self.res

my=Mydb(‘xxx‘,‘jxz‘,‘123456‘,‘jxz‘)
my.exsql(‘select * from stu;‘)
print(‘我是最后一行代码‘)

在构造函数里，进行数据库连接，并做异常处理，在执行sql语句函数中进行sql语句执行，析构函数中操作关闭游标和数据库连接。

在连接数据库的时候，有一个新的知识点：autocommit=True 自动提交，这个在以前写的数据库连接使用中并未提到，代替了之前需要判断是否是select语句，是否需要提交。

2、if name==‘main‘用法

if __name__==‘__main__‘:
一般在做测试或者调试的时候用
如果是直接运行这个python文件，这句话就没有什么用处

正常在python文件中导入其他python文件，且该python文件会正常执行

但是如果导入的python文件里有 if __name__==‘__main__‘: 这个执行结果，那么导入的这个python文件就不会执行

3、类变量，实例变量及实例方法

1）概念

类变量：公共的变量，每个实例都可以用

实例变量：成员变量

实例方法：实例化后才能用

2）self

self代表的是本类对象，因为函数里面的变量都是局部变量，出了函数就不能用了，用self给对象绑定了之后，就可以self.xx随便用了

self与实例对象的内存地址是一样的

class Baby():
    def __init__(self,name):
        print(‘self的内存地址‘,id(self))
dcg=Baby(‘测试‘)
print(‘测试的内存地址‘,id(dcg))

输出结果为：

self的内存地址 801098625712
测试的内存地址 801098625712

3）类变量，实例变量及实例方法使用

class Baby():
    country =‘China‘  #类变量，公共的变量，每个实例都可以用
    def my(self):
        self.name=‘liujia‘

abc=Baby()    
print(abc.country)  #使用类变量的值

Baby.country=‘USA‘  #类变量可以直接通过类名.xxx来进行修改
yjt=Baby()
print(yjt.country)   #类变量已经修改为USA

dcg=Baby()
dcg.country=‘Japan‘  #实例变量
print(dcg.country)

看以上这段代码，country变量是类下面，但没有在其他函数里面，是类变量，每个实例都可以用；

my()函数是一个实例方法，在实例化后才能使用；

先看实例化为abc后，打印country，那么使用的是类变量，输出为China；然后类变量进行了修改，这时候实例化为yjt，输出的country就是USA，最后实例化为

dcg，这个实例修改了country的值，最后输出的country就是Japan。

4）装饰器

4、类方法，静态方法

1）概念

类方法：

不用实例化就可以直接调用

可以通过cls使用类变量

不能调用实例方法

不想实例化的时候，可以定义成类方法

静态方法：

一个普通函数，只是写在类里面，用不了类变量，类方法，实例变量和实例方法

2）类方法

class Baby():
    country =‘China‘  #类变量，公共的变量，每个实例都可以用
    @classmethod
    def xm(cls):#cls代表的就是Baby，类方法
        print(cls.country)
        print(‘我是类方法‘)

类方法可以不用实例化，直接调用

Baby.xm()   #不实例化，直接类名调用xm这个方法

输出结果为：

China
我是类方法

当然也可以先实例化，再调用

dcg=Baby()
dcg.xm()  #实例化后，在通过实例化后的对象调用xm方法

输出也是一样的

还有一点是，类方法里面不能调用实例变量和实例方法，比如

class Baby():
    country =‘China‘  #类变量，公共的变量，每个实例都可以用
    def my(self):
        self.name=‘liujia‘
    def cry(self):
        print(‘hhh‘)
    @classmethod
    def xm(cls):#cls代表的就是Baby，类方法
        print(cls.country)
        print(‘我是类方法‘)
        cls.name    #调用不了实例变量
        cls.cry()#调用不了实例方法


Baby.xm()

不管是cls.name，还是cls.cry()，但是会运行报错的

3）静态方法

class Baby():
    @staticmethod     #静态方法
     def xh():
            print(‘这是静态方法，它和一个没写在类里面的函数一样‘)

可以注意到这个类里面的函数是没有self这个本类对象的，它就是一个普通的函数，但是也还是需要实例化后才能调用

并且调用实例变量，实例方法等都是不可以的

class Baby():
    country =‘China‘  #类变量，公共的变量，每个实例都可以用
    def my(self):
        self.name=‘liujia‘
    def cry(self):
        print(‘hhh‘)
     @staticmethod     #静态方法
    def xh():
        print(‘这是静态方法，它和一个没写在类里面的函数一样‘)
        self.name
        self.cry()