模块
绝对导入和相对导入为 Python 包的组织提供了清晰的规则。明确的导入方式让代码的依赖关系更加清晰,避免了命名冲突。
# 绝对导入
from mypackage.submodule import function
# 相对导入
from .submodule import function
from ..parentmodule import other_function
模块
模块表示一个或多个具有相关功能的 Python 代码的集合。
最小的模块是单个 Python 可执行文件。最常见的是 .py 后缀结尾的文件。
较大的模块往往是一个文件夹,内含多个 Python 可执行文件、文件夹与资源等等。
Python 的 import 不止能导入 .py 后缀结尾的文件
.pyd 是 Windows 特有的文件格式。它的作用和 .dll 相似,可直接导入而不需要 ctypes 模块。
.pyc 是由 py 文件经过编译后生成的二进制文件,py 文件变成 .pyc 文件后,加载的速度有所提高,并且可以实现源码隐藏。
Python 的 import 通过 importlib 模块自动处理这些不同格式的文件。
.so 和 .dll 分别是 Linux 和 Windows 的动态链接库,可使用 ctypes 模块导入。
.pyx 是 Cython 的源代码文件,支持 Python 与 C 代码混合编程。可以将 .pyx 文件编译为纯 C 文件,但需要注意的是,这个 C 文件通常是用来创建一个 Python 扩展模块的,它不能独立运行。需要进一步编译为 .so 或 .dll 或 .pyd 文件。
.pyi 文件是 Python 接口文件(Python Interface file),也称为存根文件(stub file)。它包含模块的类型提示,但不包含实际的实现代码。当一个模块是用 C 或 Cython 编写的(例如,编译成 .pyd 或 .so 文件),它的源代码不是 Python 格式,因此无法直接被 MyPy、Pyright 等类型检查器或 IDE 识别。这时,开发者会创建一个对应的 .pyi 文件来提供类型信息。
from,import,as
在导入模块时,可以使用from、import、as关键字来导入模块中的指定内容。
通过import关键字导入指定的模块。
通过from关键字从模块中导入指定内容。
通过as关键字给函数别名。
def foo():
print('goodbye, world!')
import module # 导入整个模块文件
module.foo()# 输出goodbye, world!
from module import foo # 从模块中导入foo函数
foo() # 输出goodbye, world!
from module import foo as foo2 # 导入模块中的foo函数,并别名为foo2
foo2() # 输出goodbye, world!
__name__ 属性
__name__ 属性是一个特殊的属性,用于获取模块的名称。
print(__name__)
"""
当模块被直接运行时,__name__的值为__main__
当模块被导入时,__name__的值为模块的名称,即module
如果你希望在模块被直接运行时执行一些代码,被导入时则不执行,可以这样写:
"""
if __name__ == "__main__":
print("This is the main module")
__init__.py与-m
通常情况下,当使用 import 语句导入模块后,Python 会按照以下顺序查找指定的模块文件:
当前目录,即当前执行的程序文件所在目录下查找;
到 PYTHONPATH(环境变量)下的每个目录中查找;
到 Python 默认的安装目录下查找。
以上所有涉及到的目录,都保存在标准模块 sys 的 sys.path 变量中,通过此变量我们可以看到指定程序文件支持查找的所有目录。换句话说,如果要导入的模块没有存储在 sys.path 显示的目录中,那么导入该模块并运行程序时,Python 解释器就会抛出 ModuleNotFoundError(未找到模块)异常。
解决“Python 找不到指定模块”的方法有 3 种,分别是:
向 sys.path 中临时添加模块文件存储位置的完整路径;
将模块放在 sys.path 变量中已包含的模块加载路径中;
设置 path 系统环境变量。
具体区别可以创建下面的文件结构来了解:
top/
├── __init__.py
├── second.py
└── second_copy.py
在 Python 中,__init__.py 文件是一个特殊的文件,它标志着一个目录是一个 Python 包(package)。当 Python 解释器在导入一个模块时,如果发现一个目录里包含了 init.py 文件,它就会将这个目录当作一个包来处理。
__init__.py 文件本身可以为空,但它也可以包含初始化包的代码。例如,你可以在里面定义变量、函数,或者导入子模块,以便在包被导入时自动执行这些代码。这使得你可以控制包的初始化行为,比如设置包级别的配置或简化子模块的导入路径。
import sys
print(sys.argv)
import sys
print(sys.argv)
from .second_copy import *
两种运行脚本的方式,以及对应的输出:
-
使用
python -m top.second运行:PS C:\Users\jiang\Desktop> python -m top.second
['C:\\Users\\jiang\\Desktop\\top\\second.py']
['C:\\Users\\jiang\\Desktop\\top\\second.py']- 输出两次相同的
sys.argv,显示脚本的完整路径。 - 没有错误,脚本正常运行。
- 输出两次相同的
-
直接运行
python top\second.py:PS C:\Users\jiang\Desktop> python top\second.py
['top\\second.py']
Traceback (most recent call last):
File "C:\Users\jiang\Desktop\top\second.py", line 3, in <module>
from .second_copy import *
ImportError: attempted relative import with no known parent package- 仅输出了
sys.argv一次,显示的是相对路径top\second.py。 - 然后抛出了
ImportError,提示“尝试进行相对导入,但没有已知的父包”。
- 仅输出了
为什么会有这样的差异?
问题的核心在于 Python 如何处理这两种运行方式,以及它们对模块结构和相对导入的影响。
1. python -m top.second 的行为
- 运行方式:使用
-m标志告诉 Python 将top.second作为一个模块运行。这里,top被识别为一个包,second是该包中的一个模块。 - 包上下文:Python 会正确设置包的层次结构。由于当前工作目录是
C:\Users\jiang\Desktop,Python 知道top是一个包,并且second.py是其中的模块。 - 相对导入:在
second.py中,from .second_copy import *是一个相对导入,.表示当前包(即top)。因为 Python 已经建立了包上下文,它能找到同一目录下的second_copy.py,导入成功。 sys.argv的值:在这种模式下,sys.argv[0]被设置为脚本的完整路径,即C:\\Users\\jiang\\Desktop\\top\\second.py。- 首先,
second.py打印这个值。 - 然后,导入
second_copy.py时,second_copy.py也打印sys.argv,因为sys.argv是全局的,不会因模块不同而改变,所以输出两次相同的结果。
- 首先,
2. python top\second.py 的行为
- 运行方式:直接通过文件路径运行
second.py,即将其作为独立的脚本执行,而不是作为一个包中的模块。 - 包上下文缺失:在这种情况下,Python 不会将
top视为一个包,而是直接运行second.py作为主模块(__main__)。因此,没有定义任何“父包”。 - 相对导入失败:
second.py中的from .second_copy import *依赖于包 结构,但由于缺少包上下文,Python 不知道.代表什么,导致抛出ImportError: attempted relative import with no known parent package。 sys.argv的值:在这里,sys.argv[0]是命令行中提供的路径,即top\second.py(相对于当前工作目录C:\Users\jiang\Desktop)。second.py打印这个值后,尝试执行相对导入时失败,因此程序终止,second_copy.py的代码未被执行。
垃圾回收机制
如果持续不断加载数据,调用函数模块,计算机的内存会溢出,Python 的垃圾回收机制采用引用计数机制,当一个对象的引用数为 0 时,它就会被垃圾回收机制回收。
import sys
# 生以下四种情况的时候,该对象的引用计数器+1
a= "hello" # 对象被创建
b=a # 对象被引用
def func(a):
return
func(a) # 对象被作为参数,传到函数中
List=[a,"a","b",2] # 对象作为一个元素,存储在容器中
sys.getrefcount(a)
# python系统内部很多地方都在使用一些常用的对象,这些对象在python解释器启动时就被创建出来。
#发生以下四种情况时,该对象的引用计数器**-1**
#该对象的别名被显式销毁时
del a
#该对象的引别名被赋予新的对象,
a = "world"
#个对象离开它的作用域,例如 func函数执行完毕时,函数里面的局部变量的引用计数器就会减一(但是全局变量不会)
#该元素从容器中删除时,或者容器被销毁时。
b = a # 当前计数器为2
del b # 删除变量b:b对应的对象的引用计数器-1 (此时计数器为1)
del a # 删除变量a:a对应的对象的引用计数器-1 (此时引用计数器为0)
# 当引用计数器为0 时,意味着没有人再使用这个对象,这个对象就变成垃圾,垃圾回收。
# 回收:1. 对象从refchain的链表移除。
# 2. 将对象进行销毁,内存归还给操作系统,可用内存就增加。
sys.getrefcount(a)
内置函数
__import__函数
函数签名:__import__(name, globals=None, locals=None, fromlist=(), level=0) -> module
参数说明:
name:要导入的模块名globals:全局命名空间locals:局部命名空间fromlist:要导入的属性列表level:导入级别
返回值:
- 返回导入的模块
math = __import__('math')
print(math.sqrt(16)) # 4.0
第三方库
优秀的第三方库有很多,例如awesome-python中列举了大量优秀的第三方库。
你也可以通过pepy.tech查看某个包的下载量来侧面了解某个包的受欢迎程度。
安装
这里第三方模块使用的基本流程以 OpenCV 为例
- 下载
pip install opencv-python - 导入
import cv2 - 使用
模块名.方法名示例:cv2.imread('cat.jpg')
这里需要注意的是:OpenCV 模块的下载名、导入名均不是 opencv,OpenCV 共有 4 种不同的下载名:opencv-python、opencv-python-headless、opencv-contrib-python、opencv-contrib-python-headless。
事实上,模块名 、下载名与导入名更多是开发者出于习惯会将名称统一,并非一种强制的规则。建议在下载模块之前先通过搜索引擎搜索。
对于复杂的模块来说,使用 help() 方法、dir() 方法不能很好的满足我们的需求。需要搭配官方文档,查阅使用实例。
第三方模块与系统模块一样,都是自定义好的一系列模块,这些模块也自然存在一些版本差异。
在使用的过程之中很可能因为版本的不匹配、方法的弃用导致示例的代码失效。
我们可以通过升级至最新版本或安装指定的版本来解决:
# 安装最新版
python -m pip install SomePackage # latest version
# 安装指定版本
python -m pip install 'SomePackage==1.0.4' # specific version
# 安装最小版本
python -m pip install 'SomePackage>=1.0.4' # minimum version
# 升级至最新版本
python -m pip install --upgrade SomePackage
此外,有些包作者会仅在 GitHub 提供源码,需要我们自己编译安装。
uv pip install . 使用 uv 安装当前目录下的包。并以拷贝的方式将其添加到 site-packages 中。
uv pip install -e . 使用 uv 安装当前目录下的包,并以符号链接的方式将其添加到 site-packages 中。
两种方式都会搜索当前项目下的 pyproject.toml 和 setup.py。如果同时存在只会使用 pyproject.toml。
在开发过程中会频繁的修改代码并导入测试,传统的方式是每次修改代码后,都需要重新构建包、重新安装包。不优雅。
符号链接(Symbolic Link)是一种文件系统对象,它指向另一个文件或目录的位置。当你访问符号链接时,操作系统会自动将符号链接解析为实际的目标文件或目录(软链接)。
这让我们可以在实际的目录中修改代码,另一边立刻能看到修改后的效果。不需要每次修改都重新构建、安装包。
在 Linux 服务器中安装包安装到全局还是用户目录下需要根据实际情况选择。
-
如果需要安装到系统环境,可以使用
--break-system-packages后缀,例如:pip install --break-system-packages requests。 -
如果需要安装到用户目录下,可以使用
--user后缀,例如:pip install --user requests。
在现代 Linux 发行版中,系统 Python 标 记为"外部管理环境"(externally managed environment)。
由操作系统的包管理器(如 apt)统一维护,禁止用户通过 pip(即使是 --user)直接安装包,以防破坏系统依赖。
如果你要安装的是 uv、ruff 这样的可执行应用程序,推荐使用 pipx 独立安装。
sudo apt install pipx
pipx install uv
pipx install ruff
如果你要安装的是 requests、opencv 这样的Python 包,推荐使用虚拟环境结合 pip 独立安装。
python3 -m venv .venv
source .venv/bin/activate
pip install requests
对于更加特殊的一些包,如ros2会使用到特定的Python包(rclpy等),ros2会将其下载到本地目录后,将这个目录添加到PYTHONPATH环境变量中。让所有Python解释器找包时都能加载这个目录内的模块。
PYTHONPATH是一个操作系统级别的环境变量,用于指定Python解释器的搜索路径。PYTHONPATH的值是一个或多个目录路径,优先级高于标准库和site-packagesPYTHONPATH只是额外添加的搜索路径,为空时不会影响默认的搜索路径。- 除了
PYTHONPATH环境变量,还有PATH等环境变量会影响Python解释器的搜索路径。你可以通过env命令查看当前所有设置的环境变量。
不过这种方式也增加了包冲突的风险,我们个人开发时使用虚拟环境管理包。
更多子命令与参数可以查看pip官方文档。
| 命令 | 作用说明 |
|---|---|
pip install | 安装 Python 包(来自 PyPI、本地文件、VCS 等) |
pip uninstall | 卸载已安装的包 |
pip inspect | 以结构化 JSON 格式输出当前环境的包信息(实验性,较新版本支持) |
pip list | 列出当前环境中所有已安装的包及其版本 |
pip show | 显示某个已安装包的详细信息(如版本、作者、依赖、位置等) |
pip freeze | 以 requirements.txt 兼容格式输出已安装包列表(常用于锁定依赖) |
pip check | 验证已安装包的依赖是否满足,检测版本冲突 |
pip lock | 生成可复现的依赖锁文件(截至 pip v25.2,此命令尚未正式实现,处于规划/实验阶段) |
pip download | 下载包及其依赖(不安装),用于离线环境或缓存 |
pip wheel | 将包构建为 wheel 格式的分发文件(.whl) |
pip hash | 计算并输出文件的哈希值(用于验证包完整性) |
pip search | 已弃用:原用于在 PyPI 上搜索包,因 API 关闭已不可用 |
pip index | 查询包在索引(如 PyPI)中的元数据(如版本、兼容性等) |
pip cache | 管理 pip 的本地缓存(查看、清空等) |
pip config | 管理 pip 的配置文件(设置镜像源、超时等) |
pip debug | 显示 pip 的调试信息(如兼容标签、环境路径、版本等) |