模块和包
模块
Python会将所有 .py 结尾的文件认定为Python代码文件,考虑下面的脚本 ex1.py :
In [1]:
%%writefile ex1.py
PI = 3.1416
def sum(lst):
    tot = lst[0]
    for value in lst[1:]:
        tot = tot + value
    return tot
w = [0, 1, 2, 3]
print sum(w), PI
Overwriting ex1.py
可以执行它:
In [2]:
%run ex1.py
6 3.1416
这个脚本可以当作一个模块,可以使用import关键词加载并执行它(这里要求ex1.py在当前工作目录):
In [3]:
import ex1
6 3.1416
In [4]:
ex1
Out[4]:
<module 'ex1' from 'ex1.py'>
在导入时,Python会执行一遍模块中的所有内容。
ex1.py 中所有的变量都被载入了当前环境中,不过要使用
ex1.变量名 
的方法来查看或者修改这些变量:
In [5]:
print ex1.PI
3.1416
In [6]:
ex1.PI = 3.141592653
print ex1.PI
3.141592653
还可以用
ex1.函数名 
调用模块里面的函数:
In [7]:
print ex1.sum([2, 3, 4])
9
为了提高效率,Python只会载入模块一次,已经载入的模块再次载入时,Python并不会真正执行载入操作,哪怕模块的内容已经改变。
例如,这里重新导入 ex1 时,并不会执行 ex1.py 中的 print 语句:
In [8]:
import ex1
需要重新导入模块时,可以使用reload强制重新载入它,例如:
In [9]:
reload(ex1)
6 3.1416
Out[9]:
<module 'ex1' from 'ex1.pyc'>
删除之前生成的文件:
In [10]:
import os
os.remove('ex1.py')
__name__ 属性
有时候我们想将一个 .py 文件既当作脚本,又能当作模块用,这个时候可以使用 __name__ 这个属性。
只有当文件被当作脚本执行的时候, __name__的值才会是 '__main__',所以我们可以:
In [11]:
%%writefile ex2.py
PI = 3.1416
def sum(lst):
    """ Sum the values in a list
    """
    tot = 0
    for value in lst:
        tot = tot + value
    return tot
def add(x, y):
    " Add two values."
    a = x + y
    return a
def test():
    w = [0,1,2,3]
    assert(sum(w) == 6)
    print 'test passed.'
if __name__ == '__main__':
    test()
Writing ex2.py
运行文件:
In [12]:
%run ex2.py
test passed.
当作模块导入, test() 不会执行:
In [13]:
import ex2
但是可以使用其中的变量:
In [14]:
ex2.PI
Out[14]:
3.1416
使用别名:
In [15]:
import ex2 as e2
e2.PI
Out[15]:
3.1416
其他导入方法
可以从模块中导入变量:
In [16]:
from ex2 import add, PI
使用 from 后,可以直接使用 add , PI:
In [17]:
add(2, 3)
Out[17]:
5
或者使用 * 导入所有变量:
In [18]:
from ex2 import *
add(3, 4.5)
Out[18]:
7.5
这种导入方法不是很提倡,因为如果你不确定导入的都有哪些,可能覆盖一些已有的函数。
删除文件:
In [19]:
import os
os.remove('ex2.py')
包
假设我们有这样的一个文件夹:
foo/
- __init__.py
- bar.py(defines func)
- baz.py(defines zap)
这意味着 foo 是一个包,我们可以这样导入其中的内容:
from foo.bar import func
from foo.baz import zap
bar 和 baz 都是 foo 文件夹下的 .py 文件。
导入包要求:
- 文件夹 foo在Python的搜索路径中
- __init__.py表示- foo是一个包,它可以是个空文件。
常用的标准库
- re 正则表达式
- copy 复制
- math, cmath 数学
- decimal, fraction
- sqlite3 数据库
- os, os.path 文件系统
- gzip, bz2, zipfile, tarfile 压缩文件
- csv, netrc 各种文件格式
- xml
- htmllib
- ftplib, socket
- cmd 命令行
- pdb
- profile, cProfile, timeit
- collections, heapq, bisect 数据结构
- mmap
- threading, Queue 并行
- multiprocessing
- subprocess
- pickle, cPickle
- struct
PYTHONPATH设置
Python的搜索路径可以通过环境变量PYTHONPATH设置,环境变量的设置方法依操作系统的不同而不同,具体方法可以网上搜索。

