首页 > 技术文章 > Python内置模块与标准库

pluse 2018-03-29 19:38 原文

Python内置模块就是标准库(模块)吗?或者说Python的自带string模块是内置模块吗?

答案是:string不是内置模块,它是标准库。也就是说Python内置模块和标准库并不是同一种东西。

什么是内置模块?在Python官方的文档这里有说到:

Python’s standard library is very extensive, offering a wide range of facilities as indicated by the long table of contents listed below. The library contains built-in modules (written in C) that provide access to system functionality such as file I/O that would otherwise be inaccessible to Python programmers, as well as modules written in Python that provide standardized solutions for many problems that occur in everyday programming

它说明到内置模块是用C写的,提供了对系统功能的访问。从Python的标准库路径下面是找不到 sys 这个库的,原因就是它是操作系统相关,用C语言编写的。可以看到 string.py 模块,它是用Python写的。

虽然前面说明了内置模块不是标准库,但是内置模块可以划分到标准库一类中去,这里需要注意的是划分归类,而不是本质相同。这里说明内置模块不是标准库似乎有点吹毛求疵的意思,好像区不区分它们没有什么意义?是的,大多数情况下,对它们之间没有做区分的必要。但是在理解Python的模块查找顺序时,这却是一个至关重要的差异。为了说明这个差异,先说明一下import的搜索路径顺序:

 import寻找模块有两(三)个步骤:

  1. 预加载(根据评论区网友纠正后添加,但博主没有搜索具体的相关说明文档)
  2. 搜索「内置模块」(built-in module)
  3. 搜索 sys.path 中的路径

而 sys.path 在初始化时,又会按照顺序添加以下路径:

  1. 当前执行脚本文件所在目录
  2. 环境变量 PYTHONPATH中列出的目录(类似环境变量 PATH,由用户定义,默认为空);
  3. 模块默认安装目录(通常是标准库)

 从上面可以发现一个问题,如果一个模块不是内置模块,并且当前执行脚本文件所在目录下有个和标准库中同名的模块,那么该模块会覆盖标准库的同名模块。举例如下:

$ tree foo
foo
├── string.py
└── test.py

0 directories, 2 files

$ cat foo/string.py 
ascii_lowercase='this is personal module'
 
$ cat foo/test.py 
import string

print string.ascii_lowercase

文件结构如上所示。执行foo/test.py脚本,可以发现结果是"this is personal module",如果我们将string.py重命名为string2.py,则执行结果是标准库string中的"abcdefghijklmnopqrstuvwxyz":

这表明标准库的string.py模块被当前脚本下的同名模块覆盖了。重命名后不再覆盖,则能正确引用相应模块了。

那么内置模块一定是C语言写的吗?答案是:不是。因为对于os.py来说,它也是内置模块,一些文件I/O模块也是内置模块,它们不可能都用C语言写成,因为Python还需要通过它们来为Python程序提供支持,对于os.py是不是内置模块持有怀疑的读者,可以自行使用上面的同名模块覆盖特性进行测试。

感谢评论区的朋友纠正,os.py 模块不是内置模块,在Python官网的文档(sys — System-specific parameters and functions — Python 3.10.2 documentation)中可以找到内置模块列表,从下面图中实测发现os模块是没有被编译到Python解释器中,同样的os.py文件可以被搜索到。

 

 

推荐阅读