谈谈Python中元类Metaclass:什么是元类

Posted 青山牧云人

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了谈谈Python中元类Metaclass:什么是元类相关的知识,希望对你有一定的参考价值。

简单的讲,元类创建了Python中所有的对象。

我们说Python是一种动态语言,而动态语言和静态语言最大的不同,就是函数和类不是编译时定义的,而是运行时动态创建的。

比方说我们要定义一个HelloWorld的class,就写一个helloworld.py模块:

class HelloWorld(object):
    def helloworld(self):
        print(Hello World!)

当Python解释器载入helloworld模块时,就会依次执行该模块的所有语句,执行结果就是动态创建出一个HelloWorld的class对象,测试如下:

>>> from helloworld import HelloWorld
>>> h = HelloWorld()
>>> h.helloworld()
Hello, world!
>>> print(type(HelloWorld))
<class type>
>>> print(type(h))
<class helloworld.HelloWorld>

type()函数用来查看一个类型或变量的类型,HelloWorld是一个class,它的类型就是type,而h是一个实例,它的类型就是class Helloworld

我们说class的定义是运行时动态创建的,而创建class的方法就是使用type()函数。

定义:type(类名, 父类的元组(针对继承的情况,可以为空),包含属性的字典(名称和值))

type()函数既可以返回一个对象的类型,又可以创建出新的类型,比如,我们可以通过type()函数创建出HelloWorld类,而无需通过class HelloWorld(object)...的定义:

>>> def helloworld_outside(self): # 先定义函数
...     print(Hello World!)
...
>>> HelloWorld = type(HelloWorld, (object,), dict(helloworld=helloworld_outside)) # 创建HelloWorld class
>>> h = HelloWorld()
>>> h.helloworld()
Hello, world!
>>> print(type(HelloWorld))
<class type>
>>> print(type(h))
<class __main__.HelloWorld>

那么要创建一个class对象,type()函数需要依次传入3个参数:

  1. class的名称;
  2. 继承的父类集合,注意Python支持多重继承,如果只有一个父类,别忘了tuple的单元素写法;
  3. class的方法名称与函数绑定,这里我们把函数helloworld_outside绑定到方法名helloworld上。

通过type()函数创建的类和直接写class是完全一样的,因为Python解释器遇到class定义时,仅仅是扫描一下class定义的语法,然后调用type()函数创建出class。

正常情况下,我们都用class Xxx...来定义类,但是,type()函数也允许我们动态创建出类来,也就是说,动态语言本身支持运行期动态创建类,这和静态语言有非常大的不同,要在静态语言运行期创建类,必须构造源代码字符串再调用编译器,或者借助一些工具生成字节码实现,本质上都是动态编译,会非常复杂。

metaclass

除了使用type()动态创建类以外,要控制类的创建行为,还可以使用metaclass。

metaclass,直译为元类,简单的解释就是:

当我们定义了类以后,就可以根据这个类创建出实例,所以:先定义类,然后创建实例。

但是如果我们想创建出类呢?那就必须根据metaclass创建出类,所以:先定义metaclass,然后创建类。

所以,metaclass允许你创建类或者修改类。换句话说,你可以把类看成是metaclass创建出来的“实例”。

metaclass是Python面向对象里最难理解,也是最难使用的魔术代码。正常情况下,你不会碰到需要使用metaclass的情况,所以,以下内容看不懂也没关系,因为基本上你不会用到。

我们先看一个简单的例子,这个metaclass可以给我们自定义的MyList增加一个add方法:

class ListMetaclass(type):
    def __new__(cls, name, bases, attrs):
        attrs[add] = lambda self, value: self.append(value)
        return type.__new__(cls, name, bases, attrs)

class MyList(list, metaclass=ListMetaclass):
    pass

下面是运行结果,测试一下MyList是否可以调用add()方法:

>>> L = MyList()
>>> L.add(1)
>> L
[1]

通过这个例子我们可以看到,自定义我们的MyList分两步:

1. 创建Metaclass,用来创建/修改类

2. 创建实际的MyList Class

首先我们来看第一步,创建Metaclass:

  • 类名的定义:定义ListMetaclass,按照默认习惯,metaclass的类名总是以Metaclass结尾,以便清楚地表示这是一个metaclass
  • Metaclass的父类:Metaclass是类的模板,所以必须从`type`类型派生:
  • 选择__new__函数作为实现"修改类"的函数:
    •   __new__的定义一般是:def __new__(cls, name,bases,attrs),实际上,“new”方法在Python中是真正的构造方法(创建并返回实例),通过这个方法可以产生一个”cls”对应的实例对象所以说”new”方法一定要有返回,要把创建的实例对象返回回去。在此,我们把对类的修改放到__new__方法中,然后返回修改过后的实例对象。另外,很简单的道理,选择type.__new__函数作为return的值,是因为我们的ListMetaclass继承自type,因此应该返回class type的__new__函数创建的对象。
    • 另外,函数__new__(cls, name,bases,attrs)中,"cls"类似于类中其他函数的self参数,例如__init__(self),只不过cls代表类本身,self代表创建的对象; name代表类的名称;bases代表当前类的父类集合;attrs代表当前类的属性,是狭义上属性和方法的集合,可以用字典dict的方式传入
class ListMetaclass(type):
    def __new__(cls, name, bases, attrs):
        attrs[add] = lambda self, value: self.append(value)
        return type.__new__(cls, name, bases, attrs)

有了ListMetaclass,我们在定义类的时候还要指示使用ListMetaclass来定制类,传入关键字参数metaclass,当我们传入关键字参数metaclass时,它指示Python解释器在创建MyList时,要通过ListMetaclass.__new__()来创建,在ListMetaclass.__new__()中,我们可以修改类的定义,比如,加上新的方法,然后,返回修改后的定义。

那么为什么传入关键字参数metaclass,就指示Python解释器在创建MyList时,要通过ListMetaclass.__new__()来创建呢?

其实,当传入关键字参数metaclass时,python会在当前class里创建属性__metaclass__。

当创建class的时候,python会先检查当前类中有没有__metaclass__,如果有,就用此方法创建对象;如果没有,则会一级一级的检查父类中有没有__metaclass__,用来创建对象。创建的这个“对象”,就是当前的这个类。如果当前类和父类都没有,则会在当前package中寻找__metaclass__方法,如果还没有,则会调用自己隐藏的的type函数来创建对象。

class MyList(list, metaclass=ListMetaclass):
    pass

测试一下MyList是否可以调用add()方法:

>>> L = MyList()
>>> L.add(1)
>> L
[1]

而普通的list没有add()方法:

>>> L2 = list()
>>> L2.add(1)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: list object has no attribute add

动态修改有什么意义?直接在MyList定义中写上add()方法不是更简单吗?正常情况下,确实应该直接写,通过metaclass修改纯属变态。

但是,总会遇到需要通过metaclass修改类定义的。ORM就是一个典型的例子。

ORM全称“Object Relational Mapping”,即对象-关系映射,就是把关系数据库的一行映射为一个对象,也就是一个类对应一个表,这样,写代码更简单,不用直接操作SQL语句。

我将会在下一次文章中详细讲讲ORM是怎么工作的。



以上是关于谈谈Python中元类Metaclass:什么是元类的主要内容,如果未能解决你的问题,请参考以下文章

python中的元类(metaclass)

(转)元类metaclass

深入理解Python中的元类---metaclass

metaclass元类解析

元类(metaclass)

metaclass(元类)