Python自省与反射

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python自省与反射相关的知识,希望对你有一定的参考价值。

参考技术A 这个也是python彪悍的特性.

自省就是面向对象的语言所写的程序在运行时,所能知道对象的类型.简单一句就是运行时能够获得对象的类型.比如type(),dir(),getattr(),hasattr(),isinstance().

反射机制就是在运行时,动态的确定对象的类型,并可以通过字符串调用对象属性、方法、导入模块,是一种基于字符串的事件驱动

通过源码注释我们知道,它返回对象是否具有指定名称的属性。而且它是通过调用getattr并捕获AttributeError异常来判断的。就像上面的属性调用,我们就可以使用hasattr(a, "test")来判断,通过源码注释我们也可以思考一下,eval这种是不是也可以实现这种方法呢?

但是这种方式是有缺陷的,因为test输出了两次,因为我们调用了两次test(),这跟我们想要的效果不一样。如果用hasattr呢,这个函数就不会在判断的时候调用一次了。

有了判断属性是否存在的函数,那么就得有获取属性的函数了.

从源码注释我们就能知道获取object对象的名为name的属性,想到与object.name,如果提供了default参数,那么当属性不存在的时候,就会返回默认值。同样是上面的例子:

从例子中我们可以看出,hasattr并没有调用test函数,而且getattr获取到的是函数对象,也没有调用它,通过我们主动执行func()才执行了a.test()函数,这样相比于exec和eval就灵活了许多。

判断和获取属性有了,那么设置属性也是需要的.

Python 自省指南与反射

Python 自省指南:https://www.ibm.com/developerworks/cn/linux/l-pyint/

From:https://my.oschina.net/taisha/blog/55597

什么是自省?

在日常生活中,自省(introspection)是一种自我检查行为。自省是指对某人自身思想、情绪、动机和行为的检查。伟大的哲学家苏格拉底将生命中的大部分时间用于自我检查,并鼓励他的雅典朋友们也这样做。他甚至对自己作出了这样的要求:“未经自省的生命不值得存在。”(请参阅 参考资料以获取关于苏格拉底更多信息的链接。)

在计算机编程中,自省是指这种能力:检查某些事物以确定它是什么、它知道什么以及它能做什么。自省向程序员提供了极大的灵活性和控制力。一旦您使用了支持自省的编程语言,就会产生类似这样的感觉:“未经检查的对象不值得实例化。”

本文介绍了 Python 编程语言的自省能力。整个 Python 语言对自省提供了深入而广泛的支持。实际上,很难想象假如 Python 语言没有其自省特性是什么样子。在读完本文时,您应该能够非常轻松地洞察到自己 Python 对象的“灵魂”。

在深入研究更高级的技术之前,我们尽可能用最普通的方式来研究 Python 自省。有些读者甚至可能会争论说:我们开始时所讨论的特性不应称之为“自省”。我们必须承认,它们是否属于自省的范畴还有待讨论。但从本文的主旨出发,我们所关心的只是找出有趣问题的答案。

现在让我们以交互方式使用 Python 来开始研究。当我们从命令行启动 Python 时,就进入了 Python shell,在这里可以输入 Python 代码,而且立刻会从 Python 解释器获得响应。(本文中列出的命令可以使用 Python 2.2.2 正确执行。如果您使用较早的版本,则可能产生不同的结果或发生错误。可以从 Python 网站下载最新版本 [请参阅 参考资料]。)

清单 1. 以交互方式启动 Python 解释器

1

2

3

4

5

$ python

Python 2.2.2 (#1, Oct 28 2002, 17:22:19)

[GCC 3.2 (Mandrake Linux 9.0 3.2-1mdk)] on linux2

Type "help", "copyright", "credits" or "license" for more information.

>>>

在让 Python 运行起来,并看到 Python 提示符( >>> )之后,您可能想知道 Python 能识别什么字。大多数编程语言都有保留字或关键字,这些字在该语言中有特殊的意义,Python 也不例外。您可能还注意到,Python 建议我们输入 help 以获取更多信息。也许我们可以向 Python 寻求一些关于关键字的帮助。

Python 的联机帮助实用程序

让我们按建议的那样,通过输入 help 来开始讨论,并观察它是否会向我们提供任何关于关键字的线索:

清单 2. 向 Python 寻求帮助

1

2

>>> help

Type help() for interactive help, or help(object) for help about object.

因为我们不知道哪些对象可能包含关键字,所以不指定任何特定对象来尝试 help() :

清单 3. 启动帮助实用程序

1

2

3

4

5

6

7

8

9

10

11

12

>>> help()

Welcome to Python 2.2!  This is the online help utility.

If this is your first time using Python, you should definitely check out

the tutorial on the Internet at http://www.python.org/doc/tut/.

Enter the name of any module, keyword, or topic to get help on writing

Python programs and using Python modules.  To quit this help utility and

return to the interpreter, just type "quit".

To get a list of available modules, keywords, or topics, type "modules",

"keywords", or "topics".  Each module also comes with a one-line summary

of what it does; to list the modules whose summaries contain a given word

such as "spam", type "modules spam".

help>

现在,我们对此的理解似乎深入了些。让我们在 help 提示符下输入 keywords :

清单 4. 用 keywords 寻求帮助

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

help> keywords

Here is a list of the Python keywords.  Enter any keyword to get more help.

and                 elif                global              or

assert              else                if                  pass

break               except              import              print

class               exec                in                  raise

continue            finally             is                  return

def                 for                 lambda              try

del                 from                not                 while

help> quit

You are now leaving help and returning to the Python interpreter.

If you want to ask for help on a particular object directly from the

interpreter, you can type "help(object)".  Executing "help('string')"

has the same effect as typing a particular string at the help> prompt.

>>>

输入 help() 后,会看到一条欢迎消息和一些指示信息,接着是 help 提示符。在提示符下输入 keywords ,则会看到一个 Python 关键字列表。我们已经获得了问题的答案,于是退出帮助实用程序,这时会看到一条简短的告别消息,并返回到 Python 提示符下。

正如您从这个示例可以看到的,Python 的联机帮助实用程序会显示关于各种主题或特定对象的信息。帮助实用程序很有用,并确实利用了 Python 的自省能力。但仅仅使用帮助不会揭示帮助是如何获得其信息的。而且,因为本文的目的是揭示 Python 自省的所有秘密,所以我们必须迅速地跳出对帮助实用程序的讨论。

在结束关于帮助的讨论之前,让我们用它来获得一个可用模块的列表。模块只是包含 Python 代码的文本文件,其名称后缀是.py 。如果在 Python 提示符下输入 help('modules') ,或在 help 提示符下输入 modules ,则会看到一长列可用模块,类似于下面所示的部分列表。自己尝试它以观察您的系统中有哪些可用模块,并了解为什么会认为 Python 是“自带电池”的。

清单 5. 部分可用模块的列表

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

>>> help('modules')

Please wait a moment while I gather a list of all available modules...

BaseHTTPServer      cgitb               marshal             sndhdr

Bastion             chunk               math                socket

CDROM               cmath               md5                 sre

CGIHTTPServer       cmd                 mhlib               sre_compile

Canvas              code                mimetools           sre_constants

    <...>

bisect              macpath             signal              xreadlines

cPickle             macurl2path         site                xxsubtype

cStringIO           mailbox             slgc (package)      zipfile

calendar            mailcap             smtpd

cgi                 markupbase          smtplib

Enter any module name to get more help.  Or, type "modules spam" to search

for modules whose descriptions contain the word "spam".

>>>

sys 模块

sys 模块是提供关于 Python 本身的详尽内在信息的模块。通过导入模块,并用点(.)符号引用其内容(如变量、函数和类)来使用模块。 sys 模块包含各种变量和函数,它们揭示了当前的 Python 解释器有趣的详细信息。让我们研究其中的一部分。我们要再次以交互方式运行 Python,并在 Python 命令提示符下输入命令。首先,我们将导入 sys 模块。然后,我们会输入sys.executable 变量,它包含到 Python 解释器的路径:

清单 6. 导入 sys 模块

1

2

3

4

5

6

7

$ python

Python 2.2.2 (#1, Oct 28 2002, 17:22:19)

[GCC 3.2 (Mandrake Linux 9.0 3.2-1mdk)] on linux2

Type "help", "copyright", "credits" or "license" for more information.

>>> import sys

>>> sys.executable

'/usr/local/bin/python'

当输入一行只包含对象名称的代码时,Python 通过显示该对象的表示进行响应,对于简单对象,往往显示对象的值。在本例中,因为所显示的值是用引号括起来的,所以我们得到一条线索: sys.executable 可能是字符串对象。稍后,我们将研究确定对象类型的其它更精确的方法,但只在 Python 提示符下输入对象名称是一种迅速而又方便的自省形式。

让我们研究 sys 模块其它一些有用的属性。

platform 变量告诉我们现在处于什么操作系统上:

sys.platform 属性

1

2

>>> sys.platform

'linux2'

在当前的 Python 中,版本以字符串和元组(元组包含对象序列)来表示:

清单 8. sys.version 和 sys.version_info 属性

1

2

3

4

>>> sys.version

'2.2.2 (#1, Oct 28 2002, 17:22:19) \\n[GCC 3.2 (Mandrake Linux 9.0 3.2-1mdk)]'

>>> sys.version_info

(2, 2, 2, 'final', 0)

maxint 变量反映了可用的最大整数值:

sys.maxint 属性

1

2

>>> sys.maxint

2147483647

argv 变量是一个包含命令行参数的列表(如果参数被指定的话)。第一项 argv[0] 是所运行脚本的路径。当我们以交互方式运行 Python 时,这个值是空字符串:

清单 10. sys.argv 属性

1

2

>>> sys.argv

['']

当运行其它 Python shell 时,如 PyCrust(有关 PyCrust 更多信息的链接,请参阅 参考资料),会看到类似于下面的信息:

清单 11. 使用 PyCrust 时的 sys.argv 属性

1

2

>>> sys.argv[0]

'/home/pobrien/Code/PyCrust/PyCrustApp.py'

path 变量是模块搜索路径,Python 在导入期间将在其中的目录列表中寻找模块。最前面的空字符串 '' 是指当前目录:

清单 12. sys.path 属性

1

2

3

4

5

6

7

>>> sys.path

['', '/home/pobrien/Code',

'/usr/local/lib/python2.2',

'/usr/local/lib/python2.2/plat-linux2',

'/usr/local/lib/python2.2/lib-tk',

'/usr/local/lib/python2.2/lib-dynload',

'/usr/local/lib/python2.2/site-packages']

modules 变量是一个字典,它将当前已装入的所有模块的名称映射到模块对象。如您所见,缺省情况下,Python 装入一些特定的模块:

清单 13. sys.modules 属性

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

>>> sys.modules

'stat': <module 'stat' from '/usr/local/lib/python2.2/stat.pyc'>,

'__future__': <module '__future__' from '/usr/local/lib/python2.2/__future__.pyc'>,

'copy_reg': <module 'copy_reg' from '/usr/local/lib/python2.2/copy_reg.pyc'>,

'posixpath': <module 'posixpath' from '/usr/local/lib/python2.2/posixpath.pyc'>,

'UserDict': <module 'UserDict' from '/usr/local/lib/python2.2/UserDict.pyc'>,

'signal': <module 'signal' (built-in)>,

'site': <module 'site' from '/usr/local/lib/python2.2/site.pyc'>,

'__builtin__': <module '__builtin__' (built-in)>,

'sys': <module 'sys' (built-in)>,

'posix': <module 'posix' (built-in)>,

'types': <module 'types' from '/usr/local/lib/python2.2/types.pyc'>,

'__main__': <module '__main__' (built-in)>,

'exceptions': <module 'exceptions' (built-in)>,

'os': <module 'os' from '/usr/local/lib/python2.2/os.pyc'>,

'os.path': <module 'posixpath' from '/usr/local/lib/python2.2/posixpath.pyc'>

keyword 模块

让我们返回到关于 Python 关键字的问题。尽管帮助向我们显示了关键字列表,但事实证明一些帮助信息是硬编码的。关键字列表恰好是硬编码的,但毕竟它的自省程度不深。让我们研究一下,能否直接从 Python 标准库的某个模块中获取这个信息。如果在 Python 提示符下输入 help('modules keywords') ,则会看到如下信息:

清单 14. 同时使用 modules 和 keywords 寻求帮助

1

2

3

>>> help('modules keywords')

Here is a list of matching modules.  Enter any module name to get more help.

keyword - Keywords (from "graminit.c")

看起来, keyword 模块好象包含关键字。在文本编辑器中打开 keyword.py 文件,我们可以看到,Python 确实可以把关键字列表显式地用作 keyword 模块的 kwlist 属性。在 keyword 模块的注释中,我们还可以看到,该模块是根据 Python 本身的源代码自动生成的,这可以保证其关键字列表是准确而完整的:

清单 15. keyword 模块的关键字列表

1

2

3

4

5

>>> import keyword

>>> keyword.kwlist

['and', 'assert', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else',

'except', 'exec', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is',

'lambda', 'not', 'or', 'pass', 'print', 'raise', 'return', 'try', 'while', 'yield']

dir() 函数

尽管查找和导入模块相对容易,但要记住每个模块包含什么却不是这么简单。您并不希望总是必须查看源代码来找出答案。幸运的是,Python 提供了一种方法,可以使用内置的 dir() 函数来检查模块(以及其它对象)的内容。

dir() 函数可能是 Python 自省机制中最著名的部分了。它返回传递给它的任何对象的属性名称经过排序的列表。如果不指定对象,则 dir() 返回当前作用域中的名称。让我们将 dir() 函数应用于 keyword 模块,并观察它揭示了什么:

清单 16. keyword 模块的属性

1

2

3

>>> dir(keyword)

['__all__', '__builtins__', '__doc__', '__file__', '__name__',

'iskeyword', 'keyword', 'kwdict', 'kwlist', 'main']

那么将它应用于我们先前讨论的 sys 模块会怎么样呢?

清单 17. sys 模块的属性

1

2

3

4

5

6

7

8

9

10

>>> dir(sys)

['__displayhook__', '__doc__', '__excepthook__', '__name__', '__stderr__',

'__stdin__', '__stdout__', '_getframe', 'argv', 'builtin_module_names',

'byteorder', 'copyright', 'displayhook', 'exc_info', 'exc_type', 'excepthook',

'exec_prefix', 'executable', 'exit', 'getdefaultencoding', 'getdlopenflags',

'getrecursionlimit', 'getrefcount', 'hexversion', 'last_traceback',

'last_type', 'last_value', 'maxint', 'maxunicode', 'modules', 'path',

'platform', 'prefix', 'ps1', 'ps2', 'setcheckinterval', 'setdlopenflags',

'setprofile', 'setrecursionlimit', 'settrace', 'stderr', 'stdin', 'stdout',

'version', 'version_info', 'warnoptions']

如果不带任何参数,则 dir() 返回当前作用域中的名称。请注意,因为我们先前导入了 keyword 和 sys ,所以它们出现在列表中。导入模块将把该模块的名称添加到当前作用域:

清单 18. 当前作用域中的名称

1

2

>>> dir()

['__builtins__', '__doc__', '__name__', 'keyword', 'sys']

我们曾经提到 dir() 函数是内置函数,这意味着我们不必为了使用该函数而导入模块。不必做任何操作,Python 就可识别内置函数。现在,我们看到调用 dir() 后返回了这个名称 __builtins__ 。也许此处有连接。让我们在 Python 提示符下输入名称 __builtins__ ,并观察 Python 是否会告诉我们关于它的任何有趣的事情:

清单 19. __builtins__ 是什么?

1

2

>>> __builtins__

<module '__builtin__' (built-in)>

因此 __builtins__ 看起来象是当前作用域中绑定到名为 __builtin__ 的模块对象的名称。(因为模块不是只有多个单一值的简单对象,所以 Python 改在尖括号中显示关于模块的信息。)注:如果您在磁盘上寻找 __builtin__.py 文件,将空手而归。这个特殊的模块对象是 Python 解释器凭空创建的,因为它包含着解释器始终可用的项。尽管看不到物理文件,但我们仍可以将 dir() 函数应用于这个对象,以观察所有内置函数、错误对象以及它所包含的几个杂项属性。

清单 20. __builtins__ 模块的属性

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

>>> dir(__builtins__)

['ArithmeticError', 'AssertionError', 'AttributeError', 'DeprecationWarning',

'EOFError', 'Ellipsis', 'EnvironmentError', 'Exception', 'False',

'FloatingPointError', 'IOError', 'ImportError', 'IndentationError',

'IndexError', 'KeyError', 'KeyboardInterrupt', 'LookupError', 'MemoryError',

'NameError', 'None', 'NotImplemented', 'NotImplementedError', 'OSError',

'OverflowError', 'OverflowWarning', 'ReferenceError', 'RuntimeError',

'RuntimeWarning', 'StandardError', 'StopIteration', 'SyntaxError',

'SyntaxWarning', 'SystemError', 'SystemExit', 'TabError', 'True', 'TypeError',

'UnboundLocalError', 'UnicodeError', 'UserWarning', 'ValueError', 'Warning',

'ZeroDivisionError', '_', '__debug__', '__doc__', '__import__', '__name__',

'abs', 'apply', 'bool', 'buffer', 'callable', 'chr', 'classmethod', 'cmp',

'coerce', 'compile', 'complex', 'copyright', 'credits', 'delattr', 'dict',

'dir', 'divmod', 'eval', 'execfile', 'exit', 'file', 'filter', 'float',

'getattr', 'globals', 'hasattr', 'hash', 'help', 'hex', 'id', 'input', 'int',

'intern', 'isinstance', 'issubclass', 'iter', 'len', 'license', 'list',

'locals', 'long', 'map', 'max', 'min', 'object', 'oct', 'open', 'ord', 'pow',

'property', 'quit', 'range', 'raw_input', 'reduce', 'reload', 'repr', 'round',

'setattr', 'slice', 'staticmethod', 'str', 'super', 'tuple', 'type', 'unichr',

'unicode', 'vars', 'xrange', 'zip']

dir() 函数适用于所有对象类型,包括字符串、整数、列表、元组、字典、函数、定制类、类实例和类方法。让我们将 dir()应用于字符串对象,并观察 Python 返回什么。如您所见,即使简单的 Python 字符串也有许多属性:

清单 21. 字符串属性

1

2

3

4

5

6

7

8

9

10

>>> dir('this is a string')

['__add__', '__class__', '__contains__', '__delattr__', '__doc__', '__eq__',

'__ge__', '__getattribute__', '__getitem__', '__getslice__', '__gt__',

'__hash__', '__init__', '__le__', '__len__', '__lt__', '__mul__', '__ne__',

'__new__', '__reduce__', '__repr__', '__rmul__', '__setattr__', '__str__',

'capitalize', 'center', 'count', 'decode', 'encode', 'endswith', 'expandtabs',

'find', 'index', 'isalnum', 'isalpha', 'isdigit', 'islower', 'isspace',

'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'replace', 'rfind',

'rindex', 'rjust', 'rstrip', 'split', 'splitlines', 'startswith', 'strip',

'swapcase', 'title', 'translate', 'upper', 'zfill']

自己尝试下列示例以观察它们返回什么。注: # 字符标记注释的开始。Python 将忽略从注释开始部分到该行结束之间的所有内容:

清单 22. 将 dir() 运用于其它对象

1

2

3

4

5

dir(42)   # Integer (and the meaning of life)

dir([])   # List (an empty list, actually)

dir(())   # Tuple (also empty)

dir()   # Dictionary (ditto)

dir(dir)  # Function (functions are also objects)

为了说明 Python 自省能力的动态本质,让我们研究将 dir() 运用于定制类和一些类实例的示例。我们将以交互方式定义自己的类,创建一些类的实例,仅向其中一个实例添加唯一的属性,并观察 Python 能否一直保存所有这些。以下是结果:

清单 23. 将 dir() 运用于定制类、类实例和属性

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

>>> class Person(object):

...     """Person class."""

...     def __init__(self, name, age):

...         self.name = name

...         self.age = age

...     def intro(self):

...         """Return an introduction."""

...         return "Hello, my name is %s and I'm %s." % (self.name, self.age)

...

>>> bob = Person("Robert", 35)   # Create a Person instance

>>> joe = Person("Joseph", 17)   # Create another

>>> joe.sport = "football"       # Assign a new attribute to one instance

>>> dir(Person)      # Attributes of the Person class

['__class__', '__delattr__', '__dict__', '__doc__', '__getattribute__',

'__hash__', '__init__', '__module__', '__new__', '__reduce__', '__repr__',

'__setattr__', '__str__', '__weakref__', 'intro']

>>> dir(bob)         # Attributes of bob

['__class__', '__delattr__', '__dict__', '__doc__', '__getattribute__',

'__hash__', '__init__', '__module__', '__new__', '__reduce__', '__repr__',

'__setattr__', '__str__', '__weakref__', 'age', 'intro', 'name']

>>> dir(joe)         # Note that joe has an additional attribute

['__class__', '__delattr__', '__dict__', '__doc__', '__getattribute__',

'__hash__', '__init__', '__module__', '__new__', '__reduce__', '__repr__',

'__setattr__', '__str__', '__weakref__', 'age', 'intro', 'name', 'sport']

>>> bob.intro()      # Calling bob's intro method

"Hello, my name is Robert and I'm 35."

>>> dir(bob.intro)   # Attributes of the intro method

['__call__', '__class__', '__cmp__', '__delattr__', '__doc__', '__get__',

'__getattribute__', '__hash__', '__init__', '__new__', '__reduce__',

'__repr__', '__setattr__', '__str__', 'im_class', 'im_func', 'im_self']

文档字符串

在许多 dir() 示例中,您可能会注意到的一个属性是 __doc__ 属性。这个属性是一个字符串,它包含了描述对象的注释。Python 称之为文档字符串或 docstring,以下是其工作原理。如果模块、类、方法或函数定义的第一条语句是字符串,那么该字符串会作为对象的 __doc__ 属性与该对象关联起来。例如,看一下 __builtins__ 对象的文档字符串。因为文档字符串通常包含嵌入的换行 \\n ,我们将使用 Python 的 print 语句,以便输出更易于阅读:

清单 24. 模块文档字符串

1

2

3

>>> print __builtins__.__doc__   # Module docstring

Built-in functions, exceptions, and other objects.

Noteworthy: None is the `nil' object; Ellipsis represents `...' in slices.

Python 甚至再次维持了在 Python shell 中以交互方式定义的类和方法上的文档字符串。让我们研究 Person 类及其 intro 方法的文档字符串:

清单 25. 类和方法文档字符串

1

2

3

4

>>> Person.__doc__         # Class docstring

'Person class.'

>>> Person.intro.__doc__   # Class method docstring

'Return an introduction.'

因为文档字符串提供了如此有价值的信息,所以许多 Python 开发环境都有自动显示对象的文档字符串的方法。让我们再看一个 dir() 函数的文档字符串:

清单 26. 函数文档字符串

1

2

3

4

5

6

7

8

9

10

>>> print dir.__doc__   # Function docstring

dir([object]) -> list of strings

Return an alphabetized list of names comprising (some of) the attributes

of the given object, and of attributes reachable from it:

No argument:  the names in the current scope.

Module object:  the module attributes.

Type or class object:  its attributes, and recursively the attributes of

    its bases.

Otherwise:  its attributes, its class's attributes, and recursively the

    attributes of its class's base classes.

检查 Python 对象

我们好几次提到了“对象(object)”这个词,但一直没有真正定义它。编程环境中的对象很象现实世界中的对象。实际的对象有一定的形状、大小、重量和其它特征。实际的对象还能够对其环境进行响应、与其它对象交互或执行任务。计算机中的对象试图模拟我们身边现实世界中的对象,包括象文档、日程表和业务过程这样的抽象对象。

类似于实际的对象,几个计算机对象可能共享共同的特征,同时保持它们自己相对较小的变异特征。想一想您在书店中看到的书籍。书籍的每个物理副本都可能有污迹、几张破损的书页或唯一的标识号。尽管每本书都是唯一的对象,但都拥有相同标题的每本书都只是原始模板的实例,并保留了原始模板的大多数特征。

对于面向对象的类和类实例也是如此。例如,可以看到每个 Python 字符串都被赋予了一些属性, dir() 函数揭示了这些属性。在前一个示例中,我们定义了自己的 Person 类,它担任创建个别 Person 实例的模板,每个实例都有自己的 name 和 age 值,同时共享自我介绍的能力。这就是面向对象。

于是在计算机术语中,对象是拥有标识和值的事物,属于特定类型、具有特定特征和以特定方式执行操作。并且,对象从一个或多个父类继承了它们的许多属性。除了关键字和特殊符号(象运算符,如 + 、 - 、 * 、 ** 、 / 、 % 、 < 、 > 等)外,Python 中的所有东西都是对象。Python 具有一组丰富的对象类型:字符串、整数、浮点、列表、元组、字典、函数、类、类实例、模块、文件等。

当您有一个任意的对象(也许是一个作为参数传递给函数的对象)时,可能希望知道一些关于该对象的情况。在本节中,我们将向您展示如何让 Python 对象回答如下问题:

  • 对象的名称是什么?
  • 这是哪种类型的对象?
  • 对象知道些什么?
  • 对象能做些什么?
  • 对象的父对象是谁?

名称

并非所有对象都有名称,但那些有名称的对象都将名称存储在其 __name__ 属性中。注:名称是从对象而不是引用该对象的变量中派生的。下面这个示例着重说明了这种区别:

清单 27. 名称中有什么?

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

$ python

Python 2.2.2 (#1, Oct 28 2002, 17:22:19)

[GCC 3.2 (Mandrake Linux 9.0 3.2-1mdk)] on linux2

Type "help", "copyright", "credits" or "license" for more information.

>>> dir()                # The dir() function

['__builtins__', '__doc__', '__name__']

>>> directory = dir      # Create a new variable

>>> directory()          # Works just like the original object

['__builtins__', '__doc__', '__name__', 'directory']

>>> dir.__name__         # What's your name?

'dir'

>>> directory.__name__   # My name is the same

'dir'

>>> __name__             # And now for something completely different

'__main__'

模块拥有名称,Python 解释器本身被认为是顶级模块或主模块。当以交互的方式运行 Python 时,局部 __name__ 变量被赋予值 '__main__' 。同样地,当从命令行执行 Python 模块,而不是将其导入另一个模块时,其 __name__ 属性被赋予值'__main__' ,而不是该模块的实际名称。这样,模块可以查看其自身的 __name__ 值来自行确定它们自己正被如何使用,是作为另一个程序的支持,还是作为从命令行执行的主应用程序。因此,下面这条惯用的语句在 Python 模块中是很常见的:

清单 28. 用于执行或导入的测试

1

2

3

4

5

6

7

8

if __name__ == '__main__':

    # Do something appropriate here, like calling a

    # main() function defined elsewhere in this module.

    main()

else:

    # Do nothing. This module has been imported by another

    # module that wants to make use of the functions,

    # classes and other useful bits it has defined.

类型

type() 函数有助于我们确定对象是字符串还是整数,或是其它类型的对象。它通过返回类型对象来做到这一点,可以将这个类型对象与 types 模块中定义的类型相比较:

清单 29. 我是您的类型吗?

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

>>> import types

>>> print types.__doc__

Define names for all type symbols known in the standard interpreter.

Types that are part of optional modules (e.g. array) are not listed.

>>> dir(types)

['BufferType', 'BuiltinFunctionType', 'BuiltinMethodType', 'ClassType',

'CodeType', 'ComplexType', 'DictProxyType', 'DictType', 'DictionaryType',

'EllipsisType', 'FileType', 'FloatType', 'FrameType', 'FunctionType',

'GeneratorType', 'InstanceType', 'IntType', 'LambdaType', 'ListType',

'LongType', 'MethodType', 'ModuleType', 'NoneType', 'ObjectType', 'SliceType',

'StringType', 'StringTypes', 'TracebackType', 'TupleType', 'TypeType',

'UnboundMethodType', 'UnicodeType', 'XRangeType', '__builtins__', '__doc__',

'__file__', '__name__']

>>> s = 'a sample string'

>>> type(s)

<type 'str'>

>>> if type(s) is types.StringType: print "s is a string"

...

s is a string

>>> type(42)

<type 'int'>

>>> type([])

<type 'list'>

>>> type()

<type 'dict'>

>>> type(dir)

<type 'builtin_function_or_method'>

标识

先前我们说过,每个对象都有标识、类型和值。值得注意的是,可能有多个变量引用同一对象,同样地,变量可以引用看起来相似(有相同的类型和值),但拥有截然不同标识的多个对象。当更改对象时(如将某一项添加到列表),这种关于对象标识的概念尤其重要,如在下面的示例中, blist 和 clist 变量引用同一个列表对象。正如您在示例中所见, id() 函数给任何给定对象返回唯一的标识符:

清单 30. 目的地……

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

>>> print id.__doc__

id(object) -> integer

Return the identity of an object.  This is guaranteed to be unique among

simultaneously existing objects.  (Hint: it's the object's memory address.)

>>> alist = [1, 2, 3]

>>> blist = [1, 2, 3]

>>> clist = blist

>>> clist

[1, 2, 3]

>>> blist

[1, 2, 3]

>>> alist

[1, 2, 3]

>>> id(alist)

145381412

>>> id(blist)

140406428

>>> id(clist)

140406428

>>> alist is blist    # Returns 1 if True, 0 if False

0

>>> blist is clist    # Ditto

1

>>> clist.append(4)   # Add an item to the end of the list

>>> clist

[1, 2, 3, 4]

>>> blist             # Same, because they both point to the same object

[1, 2, 3, 4]

>>> alist             # This one only looked the same initially

[1, 2, 3]

属性

我们已经看到对象拥有属性,并且 dir() 函数会返回这些属性的列表。但是,有时我们只想测试一个或多个属性是否存在。如果对象具有我们正在考虑的属性,那么通常希望只检索该属性。这个任务可以由 hasattr() 和 getattr() 函数来完成,如本例所示:

清单 31. 具有一个属性;获得一个属性

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

>>> print hasattr.__doc__

hasattr(object, name) -> Boolean

Return whether the object has an attribute with the given name.

(This is done by calling getattr(object, name) and catching exceptions.)

>>> print getattr.__doc__

getattr(object, name[, default]) -> value

Get a named attribute from an object; getattr(x, 'y') is equivalent to x.y.

When a default argument is given, it is returned when the attribute doesn't

exist; without it, an exception is raised in that case.

>>> hasattr(id, '__doc__')

1

>>> print getattr(id, '__doc__')

id(object) -> integer

Return the identity of an object.  This is guaranteed to be unique among

simultaneously existing objects.  (Hint: it's the object's memory address.)

可调用

可以调用表示潜在行为(函数和方法)的对象。可以用 callable() 函数测试对象的可调用性:

清单 32. 您能为我做些事情吗?

1

2

3

4

5

6

7

8

>>> print callable.__doc__

callable(object) -> Boolean

Return whether the object is callable (i.e., some kind of function).

Note that classes are callable, as are instances with a __call__() method.

>>> callable('a string')

0

>>> callable(dir)

1

实例

在 type() 函数提供对象的类型时,还可以使用 isinstance() 函数测试对象,以确定它是否是某个特定类型或定制类的实例:

清单 33. 您是那些实例中的一个吗?

1

2

3

4

5

6

7

8

9

10

11

12

13

14

>>> print isinstance.__doc__

isinstance(object, class-or-type-or-tuple) -> Boolean

Return whether an object is an instance of a class or of a subclass thereof.

With a type as second argument, return whether that is the object's type.

The form using a tuple, isinstance(x, (A, B, ...)), is a shortcut for

isinstance(x, A) or isinstance(x, B) or ... (etc.).

>>> isinstance(42, str)

0

>>> isinstance('a string', int)

0

>>> isinstance(42, int)

1

>>> isinstance('a string', str)

1

子类

我们先前提到过,定制类的实例从该类继承了属性。在类这一级别,可以根据一个类来定义另一个类,同样地,这个新类会按照层次化的方式继承属性。Python 甚至支持多重继承,多重继承意味着可以用多个父类来定义一个类,这个新类继承了多个父类。 issubclass() 函数使我们可以查看一个类是不是继承了另一个类:

清单 34. 您是我母亲吗?

1

2

3

4

5

6

7

8

9

10

11

12

13

>>> print issubclass.__doc__

issubclass(C, B) -> Boolean

Return whether class C is a subclass (i.e., a derived class) of class B.

>>> class SuperHero(Person):   # SuperHero inherits from Person...

...     def intro(self):       # but with a new SuperHero intro

...         """Return an introduction."""

...         return "Hello, I'm SuperHero %s and I'm %s." % (self.name, self.age)

...

>>> issubclass(SuperHero, Person)

1

>>> issubclass(Person, SuperHero)

0

>>>

检查时间

让我们将上一节中讨论的几种检查技术结合起来。为了做到这一点,要定义自己的函数 — interrogate() ,它打印有关传递给它的任何对象的各种信息。以下是代码,后面是其用法的几个示例:

清单 35. 谁也没料到它

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

>>> def interrogate(item):

...     """Print useful information about item."""

...     if hasattr(item, '__name__'):

...         print "NAME:    ", item.__name__

...     if hasattr(item, '__class__'):

...         print "CLASS:   ", item.__class__.__name__

...     print "ID:      ", id(item)

...     print "TYPE:    ", type(item)

...     print "VALUE:   ", repr(item)

...     print "CALLABLE:",

...     if callable(item):

...         print "Yes"

...     else:

...         print "No"

...     if hasattr(item, '__doc__'):

...         doc = getattr(item, '__doc__')

...     doc = doc.strip()   # Remove leading/trailing whitespace.

...     firstline = doc.split('\\n')[0]

...     print "DOC:     ", firstline

...

>>> interrogate('a string')     # String object

CLASS:    str

ID:       141462040

TYPE:     <type 'str'>

VALUE:    'a string'

CALLABLE: No

DOC:      str(object) -> string

>>> interrogate(42)             # Integer object

CLASS:    int

ID:       135447416

TYPE:     <type 'int'>

VALUE:    42

CALLABLE: No

DOC:      int(x[, base]) -> integer

>>> interrogate(interrogate)    # User-defined function object

NAME:     interrogate

CLASS:    function

ID:       141444892

TYPE:     <type 'function'>

VALUE:    <function interrogate at 0x86e471c>

CALLABLE: Yes

DOC:      Print useful information about item.

 接下来是Inspect模块

inspect模块主要提供了四种用处:

(1).对是否是模块,框架,函数等进行类型检查。

(2).获取源码

(3).获取类或函数的参数的信息

(4).解析堆栈

使用inspect模块可以提供自省功能,下面是关于自省的一些介绍:

 

 首先通过一个例子来看一下本文中可能用到的对象和相关概念。

#coding: UTF-8

import  sys  #  模块,sys指向这个模块对象 
 import  inspect
 def  foo():  pass  #  函数,foo指向这个函数对象   
 class  Cat(object):  #  类,Cat指向这个类对象 
  def  __init__ (self, name = ' kitty ' ):
self.name  =  name
 def  sayHi(self):  #  实例方法,sayHi指向这个方法对象,使用类或实例.sayHi访问 
  print  self.name,  ' says Hi! '  #  访问名为name的字段,使用实例.name访问 
 
cat  =  Cat()  #  cat是Cat类的实例对象 
 
 print  Cat.sayHi  #  使用类名访问实例方法时,方法是未绑定的(unbound) 
 print  cat.sayHi  #  使用实例访问实例方法时,方法是绑定的(bound)

有时候我们会碰到这样的需求,需要执行对象的某个方法,或是需要对对象的某个字段赋值,而方法名或是字段名在编码代码时并不能确定,需要通过参数传递字符串的形式输入。举个具体的例子:当我们需要实现一个通用的DBM框架时,可能需要对数据对象的字段赋值,但我们无法预知用到这个框架的数据对象都有些什么字段,换言之,我们在写框架的时候需要通过某种机制访问未知的属性。

  这个机制被称为反射(反过来让对象告诉我们他是什么),或是自省(让对象自己告诉我们他是什么,好吧我承认括号里是我瞎掰的- -#),用于实现在运行时获取未知对象的信息。反射是个很吓唬人的名词,听起来高深莫测,在一般的编程语言里反射相对其他概念来说稍显复杂,一般来说都是作为高级主题来讲;但在Python中反射非常简单,用起来几乎感觉不到与其他的代码有区别,使用反射获取到的函数和方法可以像平常一样加上括号直接调用,获取到类后可以直接构造实例;不过获取到的字段不能直接赋值,因为拿到的其实是另一个指向同一个地方的引用,赋值只能改变当前的这个引用而已。

1. 访问对象的属性

  以下列出了几个内建方法,可以用来检查或是访问对象的属性。这些方法可以用于任意对象而不仅仅是例子中的Cat实例对象;Python中一切都是对象。

cat = Cat('kitty')

print  cat.name  #  访问实例属性  cat.sayHi()  #  调用实例方法 
  print  dir(cat)  #  获取实例的属性名,以列表形式返回  if  hasattr(cat,  ' name ' ):  #  检查实例是否有这个属性  setattr(cat,  ' name' ,  ' tiger ' )  #  same as: a.name = 'tiger'  print  getattr(cat,  ' name ' )  #  same as: print a.name  getattr(cat,  'sayHi ' )()  #  same as: cat.sayHi()

  • dir([obj]): 
    调用这个方法将返回包含obj大多数属性名的列表(会有一些特殊的属性不包含在内)。obj的默认值是当前的模块对象。
  • hasattr(obj, attr): 
    这个方法用于检查obj是否有一个名为attr的值的属性,返回一个布尔值。
  • getattr(obj, attr): 
    调用这个方法将返回obj中名为attr值的属性的值,例如如果attr为'bar',则返回obj.bar。
  • setattr(obj, attr, val): 
    调用这个方法将给obj的名为attr的值的属性赋值为val。例如如果attr为'bar',则相当于obj.bar = val。

2. 访问对象的元数据

  当你对一个你构造的对象使用dir()时,可能会发现列表中的很多属性并不是你定义的。这些属性一般保存了对象的元数据,比如类的__name__属性保存了类名。大部分这些属性都可以修改,不过改动它们意义并不是很大;修改其中某些属性如function.func_code还可能导致很难发现的问题,所以改改name什么的就好了,其他的属性不要在不了解后果的情况下修改。

  接下来列出特定对象的一些特殊属性。另外,Python的文档中有提到部分属性不一定会一直提供,下文中将以红色的星号*标记,使用前你可以先打开解释器确认一下。

2.0. 准备工作:确定对象的类型

  在types模块中定义了全部的Python内置类型,结合内置方法isinstance()就可以确定对象的具体类型了。

  • isinstance(object, classinfo): 
    检查object是不是classinfo中列举出的类型,返回布尔值。classinfo可以是一个具体的类型,也可以是多个类型的元组或列表。

  types模块中仅仅定义了类型,而inspect模块中封装了很多检查类型的方法,比直接使用types模块更为轻松,所以这里不给出关于types的更多介绍,如有需要可以直接查看types模块的文档说明。本文第3节中介绍了inspect模块。

2.1. 模块(module)

  • __doc__: 文档字符串。如果模块没有文档,这个值是None。
  • *__name__: 始终是定义时的模块名;即使你使用import .. as 为它取了别名,或是赋值给了另一个变量名。
  • *__dict__: 包含了模块里可用的属性名-属性的字典;也就是可以使用模块名.属性名访问的对象。
  • __file__: 包含了该模块的文件路径。需要注意的是内建的模块没有这个属性,访问它会抛出异常!
import fnmatch as m

print  m. __doc__ .splitlines()[0]  #  Filename matching with shell patterns. 
 print  m. __name__  #  fnmatch 
 print  m. __file__  #  /usr/lib/python2

以上是关于Python自省与反射的主要内容,如果未能解决你的问题,请参考以下文章

Python的自省机制与Python 的反射机制

Python 自省指南与反射

python中的反射和自省

python学习之自省/反射

python 反射 (自省)

Python反射(自省)机制