如果你看过比较优秀的 Python 开源框架,肯定见到过元类的身影。例如,在一个类中定义了类属性 __metaclass__
,这就说明这个类使用了元类来创建。
那元类的实现原理究竟是怎样的?使用元类能帮我们在开发中解决什么样的问题?
这篇文章,我们就来看一下 Python 元类的来龙去脉。
什么是元类?
我们都知道,定义一个类,然后调用它的构造方法,就可以初始化出一个实例出来,就像下面这样:
1 | class Person(object) |
那你有没有想过,我们平时定义的类,它是如何创建出来的?
别着急,我们先来看一个例子:
1 | 1 # 创建a的类是int a是int的实例 a = |
在这个例子中,我们定义了 int
、str
、function
、class
,然后分别调用了它们的__class__
方法,这个 __class__
方法可以返回实例是如何创建出来的。
从方法返回的结果我们可以看到:
- 创建整数
a
的类是int
,也就是说a
是int
的一个实例 - 创建字符串
b
的类是str
,也就是说b
是str
的一个实例 - 创建函数
c
的类是function
,也就是说c
是function
的一个实例 - 创建实例
d
的类是class
,也就是说d
是class
的一个实例
除了这些之外,我们在开发中使用到的例如 list
、dict
也类似,你可以测试观察一下结果。
现在我们已经得知,创建这些实例的类是 int
、str
、function
、class
,那进一步思考一下,这些类又是怎么创建出来的呢?
同样地,我们也调用这些类的 __class__
方法,观察结果:
1 | 1 a = |
从结果我们可以看到,创建这些类的类,都是 type
,所以 type
就是创建所有类的「元类」。也就是说,元类的作用就是用来创建类的。
你可以这样理解:
- 元类 -> 类
- 类 -> 实例
用伪代码表示,就是下面这样:
1 | klass = MetaClass() # 元类创建类 |
是不是很有意思?
在这里,你也可以感受一下这句话的含义:Python 中一切皆对象!
无论是普通类型、方法、实例,还是类,都可以统一看作对象,它们的起源就是元类。
其实,在 Python 中,使用 type
方法,我们可就以创建出一个类,type
方法的语法如下:
1 | type(class_name, (base_class, ...), {attr_key: attr_value, ...}) |
例如,像下面这样,我们使用 type
方法创建 MyClass 类,并且让它继承 object
:
1 | 'MyClass', (object, ), {}) # type创建一个类,继承object A = type( |
我们还可以使用 type
创建一个包含属性和方法的类:
1 | def foo(self): |
通过 type
方法创建的类,和我们自己定义一个类,在使用上没有任何区别。
其实,除了使用 type
方法创建一个类之外,我们还可以使用类属性 __metaclass__
创建一个类,这就是下面要讲的「自定义元类」。
自定义元类
我们可以使用类属性 __metaclass__
把一个类的创建过程,转交给其它地方,可以像下面这样写:
1 | class A(object): |
这个例子中,我们先定义了类 A,然后定义了一个类属性 __metaclass__
,这个属性表示创建类 A 的过程,转交给其它地方处理。
那么,这个类属性 __metaclass__
需要怎么写呢?
其实,它可以是一个方法,也可以是一个类。
用方法创建类
如果类属性 __metaclass__
赋值的是一个方法,那么创建类的过程,就交给了一个方法来执行。
1 | def create_class(name, bases, attr): |
我们定义了 create_class
方法,然后赋值给 __metaclass__
,那么类 A 被创建时,就会调用 create_class
方法。
而 create_class
方法中的逻辑,就是我们上面所讲到的,使用 type
方法创建出一个类,然后返回。
用类创建类
明白了用方法创建类之后,我们来看一下用类来创建另一个类。
1 | class B(type): |
在这个例子中,我们定义了类 B,然后把它赋值给了 A 的类变量 __metaclass__
,这就表示创建 A 的过程,交给了类 B。
B 在定义时,首先继承了 type
,然后定义了 __new__
方法,最后调用 type
方法返回了一个类,这样当创建类 A 时,会自动调用类 B 的 __new__
方法,然后得到一个类实例。
创建类的过程
好了,上面我们演示了通过元类创建一个类的两种方式,分别是通过方法创建和通过类创建。
其实创建一个类的完整流程如下:
- 检查类中是否有
__metaclass__
属性,如果有,则调用__metaclass__
指定的方法或类创建 - 如果类中没有
__metaclass__
属性,那么会继续在父类中寻找 - 如果任何父类中都没有,那么就用
type
创建这个类
也就是说,如果我们没有指定 __metaclass__
,那么所有的类都是默认由 type
创建,这种情况是我们大多数定义类时的流程。
如果类中指定了 __metaclass__
,那么这个类的创建就会交给外部来做,外部可以定义具体的创建逻辑。
哪种创建类的方式更好?
虽然有两种方式可以创建类,那么哪种方式更好呢?
一般我们建议使用类的方式创建,它的优点如下:
- 使用类更能清楚地表达意图
- 使用类更加 OOP,因为类可以继承其他类,而且可以更友好地使用面向对象特性
- 使用类可以更好地组织代码结构
另外,使用类创建一个类时,这里有一个优化点:在 __new__
方法中不建议直接调用 type
方法,而是建议调用 super
的 __new__
来创建类,执行结果与 type
方法是一样的:
1 | class B(type): |
创建类时自定义行为
前面我们用元类创建一个类时,它的功能非常简单。现在我们来看一下,使用元类创建类时,如何定义一些自己的逻辑,然后改变类的属性或行为。
我们看下面这个例子:
1 | # coding: utf8 |
在这个例子中,我们定义了一个元类 Meta
,然后在定义类 A 和 B 时,把创建类的过程交给了 Meta
,在 Meta
类中,我们可以拿到 A 和 B 的属性,然后把它们的属性都转换成了大写。
所以当我们打印 A 和 B 的属性时,虽然定义的变量是小写的,但输出结果都变成了大写,这就是元类发挥的作用。
使用场景
了解了元类的实现原理,那么元类都会用在哪些场景呢?
我们在开发中其实用的并不多,元类的使用,经常会出现在一些框架中,例如Django ORM
、peewee
,下面是使用 Django ORM
定义一个数据表映射类的代码:
1 | class Person(models.Model): |
仔细看在这段代码中,我们定义了一个 Person
类,然后在类中定义了类属性 name
和 age
,它们的类型分别是 CharField
和 IntegerField
,之后我们初始化 Person
实例,然后通过实例获取 name
和 age
属性,输出的却是 str
和 int
,而不再是 CharField
和 IntegerField
。
能做到这样的秘密就在于,Person
类在创建时,它的逻辑交给了另一个类,这个类针对类属性进行了转换,最终变成对象与数据表的映射,通过转换映射,我们就可以通过实例属性的方式,友好地访问表中对应的字段值了。
总结
总结一下,这篇文章我们讲了元类的实现原理,了解到元类是创建所有类的根源,我们可以通过 type
方法,或者在类中定义 __metaclass__
的方式,把创建类的过程交给外部。
当使用 __metaclass__
创建类时,它可以是一个方法,也可以是一个类。我们通常会使用类的方式去实现一个元类,这样做更方便我们组织代码,实现面向对象。
在使用元类创建一个类时,我们可以修改创建类的细节,例如对属性做统一的转换,或者增加新的方法等等,这对于我们开发一个复杂功能的类很友好,它可以把创建类的细节屏蔽在元类中,所以元类常常用在优秀的开源框架中。