首页 > 技术文章 > Python学习笔记

gofighting 2016-04-25 10:00 原文

目录

一、安装、编译与运行

二、变量、运算与表达式

三、数据类型

      1、数字

      2、字符串

      3、元组

      4、列表

      5、字典

四、流程控制

      1、if-else

      2、for

      3、while

      4、switch

五、函数

      1、自定义函数

      2、Lambda函数

      3、Python内置函数

六、包与模块

      1、模块module

      2、包package

七、正则表达式

      1、元字符

      2、常用函数

      3、分组 

      4、一个小实例-爬虫

八、深拷贝与浅拷贝

九、文件与目录

      1、文件读写

      2、OS模块

      3、目录遍历

十、异常处理

 

一、安装、编译与运行

       Python的安装很容易,直接到官网:http://www.python.org/下载安装就可以了。Ubuntu一般都预安装了。没有的话,就可以#apt-get install python。Windows的话直接下载msi包安装即可。Python 程序是通过解释器执行的,所以安装后,可以看到Python提供了两个解析器,一个是IDLE (Python GUI),一个是Python (command line)。前者是一个带GUI界面的版本,后者实际上和在命令提示符下运行python是一样的。运行解释器后,就会有一个命令提示符>>>,在提示符后键入你的程序语句,键入的语句将会立即执行。就像Matlab一样。

       另外,Matlab有.m的脚步文件,python也有.py后缀的脚本文件,这个文件除了可以解释执行外,还可以编译运行,编译后运行速度要比解释运行要快。

       例如,我要打印一个helloWorld。

方法1:直接在解释器中,>>> print ‘helloWorld’。

方法2:将这句代码写到一个文件中,例如hello.py。运行这个文件有三种方式:

1)在终端中:python hello.py

2)先编译成.pyc文件:

import py_compile

py_compile.compile("hello.py")

再在终端中:python hello.pyc

3)在终端中:

python -O -m py_compile hello.py

python hello.pyo

       编译成.pyc和.pyo文件后,执行的速度会更快。所以一般一些重复性并多次调用的代码会被编译成这两种可执行的方式来待调用。

 

二、变量、运算与表达式

         这里没什么好说的,有其他语言的编程基础的话都没什么问题。和Matlab的相似度比较大。这块差别不是很大。具体如下:

         需要注意的一个是:5/2 等于2,5.0/2才等于2.5。

 

[python] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. ###################################  
  2. ### compute #######  
  3. # raw_input() get input from keyboard to string type  
  4. # So we should transfer to int type  
  5. # Some new support computing type:  
  6. # and or not in is < <= != == | ^ & << + - / % ~ **  
  7. print 'Please input a number:'  
  8. number = int(raw_input())   
  9. number += 1  
  10. print number**# ** means ^  
  11. print number and 1  
  12. print number or 1  
  13. print not number  
  14. 5/# is 2  
  15. 5.0/# is 2.5, should be noted  

 

 

三、数据类型

1、数字

         通常的int, long,float,long等等都被支持。而且会看你的具体数字来定义变量的类型。如下:

 

[python] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. ###################################  
  2. ### type of value #######  
  3. # int, long, float  
  4. # do not need to define the type of value, python will  
  5. # do this according to your value  
  6. num = 1   # stored as int type  
  7. num = 1111111111111   # stored as long int type  
  8. num = 1.0   # stored as float type  
  9. num = 12L # L stands for long type  
  10. num = 1 + 12j # j stands for complex type  
  11. num = '1' # string type  

 

 

2、字符串

         单引号,双引号和三引号都可以用来定义字符串。三引号可以定义特别格式的字符串。字符串作为一种序列类型,支持像Matlab一样的索引访问和切片访问。

 

[python] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. ###################################  
  2. ### type of string #######  
  3. num = "1" # string type  
  4. num = "Let's go" # string type  
  5. num = "He's \"old\"" # string type  
  6. mail = "Xiaoyi: \n hello \n I am you!"  
  7. mail = """Xiaoyi: 
  8.     hello 
  9.     I am you! 
  10.     """ # special string format  
  11. string = 'xiaoyi' # get value by index  
  12. copy = string[0] + string[1] + string[2:6] # note: [2:6] means [2 5] or[2 6)  
  13. copy = string[:4] # start from 1  
  14. copy = string[2:] # to end  
  15. copy = string[::1] # step is 1, from start to end  
  16. copy = string[::2] # step is 2  
  17. copy = string[-1] # means 'i', the last one  
  18. copy = string[-4:-2:-1] # means 'yoa', -1 step controls direction  
  19. memAddr = id(num) # id(num) get the memory address of num  
  20. type(num) # get the type of num  

 

 

3、元组

         元组tuple用()来定义。相当于一个可以存储不同类型数据的一个数组。可以用索引来访问,但需要注意的一点是,里面的元素不能被修改。

 

[python] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. ###################################  
  2. ### sequence type #######  
  3. ## can access the elements by index or slice  
  4. ## include: string, tuple(or array? structure? cell?), list  
  5. # basis operation of sequence type  
  6. firstName = 'Zou'  
  7. lastName = 'Xiaoyi'  
  8. len(string) # the length  
  9. name = firstName + lastName # concatenate 2 string  
  10. firstName * # repeat firstName 3 times  
  11. 'Z' in firstName # check contain or not, return true  
  12. string = '123'  
  13. max(string)  
  14. min(string)  
  15. cmp(firstName, lastName) # return 1, -1 or 0  
  16.   
  17. ## tuple(or array? structure? cell?)  
  18. ## define this type using ()  
  19. user = ("xiaoyi", 25, "male")  
  20. name = user[0]  
  21. age = user[1]  
  22. gender = user[2]  
  23. t1 = () # empty tuple  
  24. t2 = (2, ) # when tuple has only one element, we should add a extra comma  
  25. user[1] = 26 # error!! the elements can not be changed  
  26. name, age, gender = user # can get three element respectively  
  27. a, b, c = (1, 2, 3)  

 

 

4、列表

         列表list用[]来定义。它和元组的功能一样,不同的一点是,里面的元素可以修改。List是一个类,支持很多该类定义的方法,这些方法可以用来对list进行操作。

 

[python] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. ## list type (the elements can be modified)  
  2. ## define this type using []  
  3. userList = ["xiaoyi", 25, "male"]  
  4. name = userList[0]  
  5. age = userList[1]  
  6. gender = userList[2]  
  7. userList[3] = 88888 # error! access out of range, this is different with Matlab  
  8. userList.append(8888) # add new elements  
  9. "male" in userList # search  
  10. userList[2] = 'female' # can modify the element (the memory address not change)  
  11. userList.remove(8888) # remove element  
  12. userList.remove(userList[2]) # remove element  
  13. del(userList[1]) # use system operation api  
  14. ## help(list.append)  
  15.   
  16. ################################  
  17. ######## object and class ######  
  18. ## object = property + method  
  19. ## python treats anything as class, here the list type is a class,  
  20. ## when we define a list "userList", so we got a object, and we use  
  21. ## its method to operate the elements  

 

 

5、字典

         字典dictionary用{}来定义。它的优点是定义像key-value这种键值对的结构,就像struct结构体的功能一样。它也支持字典类支持的方法进行创建和操作。

 

 

[python] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. ################################  
  2. ######## dictionary type ######  
  3. ## define this type using {}  
  4. item = ['name', 'age', 'gender']  
  5. value = ['xiaoyi', '25', 'male']  
  6. zip(item, value) # zip() will produce a new list:   
  7. # [('name', 'xiaoyi'), ('age', '25'), ('gender', 'male')]  
  8. # but we can not define their corresponding relationship  
  9. # and we can define this relationship use dictionary type  
  10. # This can be defined as a key-value manner  
  11. # dic = {key1: value1, key2: value2, ...}, key and value can be any type  
  12. dic = {'name': 'xiaoyi', 'age': 25, 'gender': 'male'}  
  13. dic = {1: 'zou', 'age':25, 'gender': 'male'}  
  14. # and we access it like this: dic[key1], the key as a index  
  15. print dic['name']  
  16. print dic[1]  
  17. # another methods create dictionary  
  18. fdict = dict(['x', 1], ['y', 2]) # factory mode  
  19. ddict = {}.fromkeys(('x', 'y'), -1) # built-in mode, default value is the same which is none  
  20. # access by for circle  
  21. for key in dic  
  22.     print key  
  23.     print dic[key]  
  24.   
  25. # add key or elements to dictionary, because dictionary is out of sequence,  
  26. # so we can directly and a key-value pair like this:  
  27. dic['tel'] = 88888    
  28. # update or delete the elements  
  29. del dic[1] # delete this key  
  30. dic.pop('tel') # show and delete this key  
  31. dic.clear() # clear the dictionary  
  32. del dic # delete the dictionary  
  33. dic.get(1) # get the value of key  
  34. dic.get(1, 'error') # return a user-define message if the dictionary do not contain the key  
  35. dic.keys()  
  36. dic.values()  
  37. dic.has_key(key)  
  38. # dictionary has many operations, please use help to check out  

 

 

四、流程控制

         在这块,Python与其它大多数语言有个非常不同的地方,Python语言使用缩进块来表示程序逻辑(其它大多数语言使用大括号等)。例如:

if age < 21:

    print("你不能买酒。")

    print("不过你能买口香糖。")

print("这句话处于if语句块的外面。")

         这个代码相当于c语言的:

if (age < 21)

{

    print("你不能买酒。")

    print("不过你能买口香糖。")

}

print("这句话处于if语句块的外面。")

       可以看到,Python语言利用缩进表示语句块的开始和退出(Off-side规则),而非使用花括号或者某种关键字。增加缩进表示语句块的开始(注意前面有个:号),而减少缩进则表示语句块的退出。根据PEP的规定,必须使用4个空格来表示每级缩进(不清楚4个空格的规定如何,在实际编写中可以自定义空格数,但是要满足每级缩进间空格数相等)。使用Tab字符和其它数目的空格虽然都可以编译通过,但不符合编码规范。

       为了使我们自己编写的程序能很好的兼容别人的程序,我们最好还是按规范来,用四个空格来缩减(注意,要么都是空格,要是么都制表符,千万别混用)。

1、if-else

         If-else用来判断一些条件,以执行满足某种条件的代码。

 

[python] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. ################################  
  2. ######## procedure control #####  
  3. ## if else  
  4. if expression: # bool type and do not forget the colon  
  5.     statement(s) # use four space key   
  6.   
  7. if expression:   
  8. statement(s) # error!!!! should use four space key   
  9.       
  10. if 1<2:  
  11.     print 'ok, ' # use four space key  
  12.     print 'yeah' # use the same number of space key  
  13.       
  14. if True: # true should be big letter True  
  15.     print 'true'  
  16.   
  17. def fun():  
  18.     return 1  
  19.   
  20. if fun():  
  21.     print 'ok'  
  22. else:  
  23.     print 'no'  
  24.       
  25. con = int(raw_input('please input a number:'))  
  26. if con < 2:  
  27.     print 'small'  
  28. elif con > 3:  
  29.     print 'big'  
  30. else:  
  31.     print 'middle'  
  32.       
  33. if 1 < 2:  
  34.     if 2 < 3:  
  35.         print 'yeah'  
  36.     else:  
  37.         print 'no'    
  38.     print 'out'  
  39. else:  
  40.     print 'bad'  
  41.   
  42. if 1<and 2<or 2 < not 0: # and, or, not  
  43.     print 'yeah'  

 

 

2、for

         for的作用是循环执行某段代码。还可以用来遍历我们上面所提到的序列类型的变量。

 

[python] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. ################################  
  2. ######## procedure control #####  
  3. ## for  
  4. for iterating_val in sequence:  
  5.     statements(s)  
  6. # sequence type can be string, tuple or list  
  7.   
  8. for i in "abcd":  
  9.     print i  
  10.   
  11. for i in [1, 2, 3, 4]:  
  12.     print i  
  13.   
  14. # range(start, end, step), if not set step, default is 1,   
  15. # if not set start, default is 0, should be noted that it is [start, end), not [start, end]  
  16. range(5) # [0, 1, 2, 3, 4]  
  17. range(1, 5) # [1, 2, 3, 4]  
  18. range(1, 10, 2) # [1, 3, 5, 7, 9]  
  19. for i in range(1, 100, 1):   
  20.     print i  
  21.   
  22. # ergodic for basis sequence  
  23. fruits = ['apple', 'banana', 'mango']  
  24. for fruit in range(len(fruits)):   
  25.     print 'current fruit: ', fruits[fruit]  
  26.   
  27. # ergodic for dictionary  
  28. dic = {1: 111, 2: 222, 5: 555}  
  29. for x in dic:  
  30.     print x, ': ', dic[x]  
  31.       
  32. dic.items() # return [(1, 111), (2, 222), (5, 555)]  
  33. for key,value in dic.items(): # because we can: a,b=[1,2]  
  34.     print key, ': ', value  
  35. else:  
  36.     print 'ending'  
  37.   
  38. ################################  
  39. import time  
  40. # we also can use: break, continue to control process  
  41. for x in range(1, 11):  
  42.     print x  
  43.     time.sleep(1) # sleep 1s  
  44.     if x == 3:  
  45.         pass # do nothing  
  46.     if x == 2:  
  47.         continue  
  48.     if x == 6:  
  49.         break  
  50.     if x == 7:    
  51.         exit() # exit the whole program  
  52.     print '#'*50  

 

 

3、while

         while的用途也是循环。它首先检查在它后边的循环条件,若条件表达式为真,它就执行冒号后面的语句块,然后再次测试循环条件,直至为假。冒号后面的缩近语句块为循环体。

 

[python] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. ################################  
  2. ######## procedure control #####  
  3. ## while  
  4. while expression:  
  5.     statement(s)  
  6.   
  7. while True:  
  8.     print 'hello'  
  9.     x = raw_input('please input something, q for quit:')  
  10.     if x == 'q':  
  11.         break  
  12. else:  
  13.     print 'ending'  

 

 

4、switch

         其实Python并没有提供switch结构,但我们可以通过字典和函数轻松的进行构造。例如:

 

[python] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. #############################  
  2. ## switch ####  
  3. ## this structure do not support by python  
  4. ## but we can implement it by using dictionary and function  
  5. ## cal.py ##  
  6. #!/usr/local/python  
  7.   
  8. from __future__ import division  
  9. # if used this, 5/2=2.5, 6/2=3.0  
  10.   
  11. def add(x, y):  
  12.     return x + y  
  13. def sub(x, y):  
  14.     return x - y  
  15. def mul(x, y):  
  16.     return x * y  
  17. def div(x, y):  
  18.     return x / y  
  19.   
  20. operator = {"+": add, "-": sub, "*": mul, "/": div}  
  21. operator["+"](1, 2) # the same as add(1, 2)  
  22. operator["%"](1, 2) # error, not have key "%", but the below will not  
  23. operator.get("+")(1, 2) # the same as add(1, 2)  
  24.   
  25. def cal(x, o, y):  
  26.     print operator.get(o)(x, y)  
  27. cal(2, "+", 3)  
  28. # this method will effect than if-else  

 

 

五、函数

1、自定义函数

         在Python中,使用def语句来创建函数:

 

[python] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. ################################  
  2. ######## function #####   
  3. def functionName(parameters): # no parameters is ok  
  4.     bodyOfFunction  
  5.   
  6. def add(a, b):  
  7.     return a+b # if we do not use a return, any defined function will return default None   
  8.       
  9. a = 100  
  10. b = 200  
  11. sum = add(a, b)  
  12.   
  13. ##### function.py #####  
  14. #!/usr/bin/python  
  15. #coding:utf8  # support chinese  
  16. def add(a = 1, b = 2): # default parameters  
  17.     return a+b  # can return any type of data  
  18. # the followings are all ok  
  19. add()  
  20. add(2)  
  21. add(y = 1)  
  22. add(3, 4)  
  23.   
  24. ###### the global and local value #####  
  25. ## global value: defined outside any function, and can be used  
  26. ##              in anywhere, even in functions, this should be noted  
  27. ## local value: defined inside a function, and can only be used  
  28. ##              in its own function  
  29. ## the local value will cover the global if they have the same name  
  30. val = 100 # global value  
  31. def fun():  
  32.     print val # here will access the val = 100  
  33. print val # here will access the val = 100, too  
  34.   
  35. def fun():  
  36.     a = 100 # local value  
  37.     print a  
  38. print a # here can not access the a = 100  
  39.   
  40. def fun():  
  41.     global a = 100 # declare as a global value  
  42.     print a  
  43.   
  44. print a # here can not access the a = 100, because fun() not be called yet  
  45. fun()  
  46. print a # here can access the a = 100  
  47.   
  48. ############################  
  49. ## other types of parameters  
  50. def fun(x):  
  51.     print x  
  52. # the follows are all ok  
  53. fun(10) # int  
  54. fun('hello') # string  
  55. fun(('x', 2, 3))  # tuple  
  56. fun([1, 2, 3])    # list  
  57. fun({1: 1, 2: 2}) # dictionary  
  58.   
  59. ## tuple  
  60. def fun(x, y):  
  61.     print "%s : %s" % (x,y) # %s stands for string  
  62. fun('Zou', 'xiaoyi')  
  63. tu = ('Zou', 'xiaoyi')  
  64. fun(*tu)    # can transfer tuple parameter like this  
  65.   
  66. ## dictionary  
  67. def fun(name = "name", age = 0):  
  68.     print "name: %s" % name  
  69.     print "age: " % age  
  70. dic = {name: "xiaoyi", age: 25} # the keys of dictionary should be same as fun()  
  71. fun(**dic) # can transfer dictionary parameter like this  
  72. fun(age = 25, name = 'xiaoyi') # the result is the same  
  73. ## the advantage of dictionary is can specify value name  
  74.   
  75. #############################  
  76. ## redundancy parameters ####  
  77. ## the tuple  
  78. def fun(x, *args): # the extra parameters will stored in args as tuple type   
  79.     print x  
  80.     print args  
  81. # the follows are ok  
  82. fun(10)  
  83. fun(10, 12, 24) # x = 10, args = (12, 24)  
  84.   
  85. ## the dictionary  
  86. def fun(x, **args): # the extra parameters will stored in args as dictionary type   
  87.     print x  
  88.     print args  
  89. # the follows are ok  
  90. fun(10)  
  91. fun(x = 10, y = 12, z = 15) # x = 10, args = {'y': 12, 'z': 15}  
  92.   
  93. # mix of tuple and dictionary  
  94. def fun(x, *args, **kwargs):  
  95.     print x  
  96.     print args  
  97.     print kwargs  
  98. fun(1, 2, 3, 4, y = 10, z = 12) # x = 1, args = (2, 3, 4), kwargs = {'y': 10, 'z': 12}  

 

 

2、Lambda函数

         Lambda函数用来定义一个单行的函数,其便利在于:

 

[python] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. #############################  
  2. ## lambda function ####  
  3. ## define a fast single line function  
  4. fun = lambda x,y : x*y # fun is a object of function class  
  5. fun(2, 3)  
  6. # like  
  7. def fun(x, y):  
  8.     return x*y  
  9.   
  10. ## recursion  
  11. # 5=5*4*3*2*1, n!  
  12. def recursion(n):  
  13.     if n > 0:  
  14.         return n * recursion(n-1) ## wrong  
  15.   
  16. def mul(x, y):  
  17.     return x * y  
  18. numList = range(1, 5)  
  19. reduce(mul, numList) # 5! = 120  
  20. reduce(lambda x,y : x*y, numList) # 5! = 120, the advantage of lambda function avoid defining a function  
  21.   
  22. ### list expression  
  23. numList = [1, 2, 6, 7]  
  24. filter(lambda x : x % 2 == 0, numList)  
  25. print [x for x in numList if x % 2 == 0] # the same as above  
  26. map(lambda x : x * 2 + 10, numList)  
  27. print [x * 2 + 10 for x in numList] # the same as above  

 

 

3、Python内置函数

       Python内置了很多函数,他们都是一个个的.py文件,在python的安装目录可以找到。弄清它有那些函数,对我们的高效编程非常有用。这样就可以避免重复的劳动了。下面也只是列出一些常用的:

 

[python] view plain copy
 在CODE上查看代码片派生到我的代码片
    1. ###################################  
    2. ## built-in function of python ####  
    3. ## if do not how to use, please use help()  
    4. abs, max, min, len, divmod, pow, round, callable,  
    5. isinstance, cmp, range, xrange, type, id, int()  
    6. list(), tuple(), hex(), oct(), chr(), ord(), long()  
    7.   
    8. callable # test a function whether can be called or not, if can, return true  
    9. # or test a function is exit or not  
    10.   
    11. isinstance # test type  
    12. numList = [1, 2]  
    13. if type(numList) == type([]):  
    14.     print "It is a list"  
    15. if isinstance(numList, list): # the same as above, return true  
    16.     print "It is a list"  
    17.       
    18. for i in range(1, 10001) # will create a 10000 list, and cost memory  
    19. for i in xrange(1, 10001)# do not create such a list, no memory is cost  
    20.   
    21. ## some basic functions about string  
    22. str = 'hello world'  
    23. str.capitalize() # 'Hello World', first letter transfer to big  
    24. str.replace("hello", "good") # 'good world'  
    25. ip = "192.168.1.123"  
    26. ip.split('.') # return ['192', '168', '1', '123']  
    27. help(str.split)  
    28.   
    29. import string  
    30. str = 'hello world'  
    31. string.replace(str, "hello", "good") # 'good world'  
    32.   
    33. ## some basic functions about sequence  
    34. len, max, min  
    35. # filter(function or none, sequence)  
    36. def fun(x):  
    37.     if x > 5:  
    38.         return True  
    39. numList = [1, 2, 6, 7]  
    40. filter(fun, numList) # get [6, 7], if fun return True, retain the element, otherwise delete it  
    41. filter(lambda x : x % 2 == 0, numList)  
    42. # zip()  
    43. name = ["me", "you"]  
    44. age = [25, 26]  
    45. tel = ["123", "234"]  
    46. zip(name, age, tel) # return a list: [('me', 25, '123'), ('you', 26, '234')]  
    47. # map()  
    48. map(None, name, age, tel) # also return a list: [('me', 25, '123'), ('you', 26, '234')]  
    49. test = ["hello1", "hello2", "hello3"]  
    50. zip(name, age, tel, test) # return [('me', 25, '123', 'hello1'), ('you', 26, '234', 'hello2')]  
    51. map(None, name, age, tel, test) # return [('me', 25, '123', 'hello1'), ('you', 26, '234', 'hello2'), (None, None, None, 'hello3')]  
    52. a = [1, 3, 5]  
    53. b = [2, 4, 6]  
    54. def mul(x, y):  
    55.     return x*y  
    56. map(mul, a, b) # return [2, 12, 30]  
    57. # reduce()  
    58. reduce(lambda x, y: x+y, [1, 2, 3, 4, 5]) # return ((((1+2)+3)+4)+5)  

正则表达式:

推荐阅读