首页 > 技术文章 > 【python】-- 文件操作

Keep-Ambition 2017-03-25 12:52 原文

一、概述

我们工作中需要经常操作文件,下面就讲讲如何用Python操作文件

1、文件操作的流程:

  • 打开文件,得到文件句柄赋值给一个变量
  • 通过文件句柄,对文件进行操作
  • 关闭文件
    #获取文件句柄
    f = open("yesterday","r",encoding="utf-8")
    #读取数据
    data = f.read()
    #打印读取的文件
    print(data)
    #关闭文件
    f.close()

    注: f 又叫文件句柄,它包含文件的文件名、文件的字符集、文件的大小、文件在硬盘上的起始位置

2、两次读取,第二次读取无内容解疑:

 

因为在文件中 ,维护一个类似文件指针的一个东西,这个文件指针类似于我们平时操作文件时的光标的东西,所以当第1次读文件时,文件指针已经指向最后一个位置,所以第2次再去读取的时候,是从最后一个位置开始读取的,所以读取的为空。

那怎么再重新读取数据呐?把光标移动到开始位即可

读取内容:

Somehow, it seems the love I knew was always the most destructive kind

Yesterday when I was young
View Code
f = open("yesterday2","r",encoding="utf-8")
#第1次读取
data = f.read()
#第2次读取
data2 = f.read()
print(data)
print("----------------data2-----%s----"%(data2))
f.close()
#输出结果
Somehow, it seems the love I knew was always the most destructive kind

Yesterday when I was young

----------------data2---------
View Code

 

二、文件打开模式:

1、打开文件的模式有:

  注:在读取文件之前最好导入os模块,判断一下文件是否存在,这是一个好习惯

filename = r"C:\Users\dell\PycharmProjects\untitled\home_work\week4\haproxy"
if os.path.exists(filename):
    #再进行获取文件句柄操作
View Code
  • r,英文:read,只读模式(默认)
  • w,英文:write,只写模式(不可读,不存在则创建新文件,存在则删除内容)
  • a,英文:append,追加模式(不可读,不存在则创建,存在则只追加内容)
f = open("yesterday","r",encoding="utf-8")
data = f.read()
print(date)
f.close()
#注:读操作,只能是只读,不能写和追加

#############################

f = open("yesterday2","w",encoding="utf-8")
f.write("qqqqqq")
f.close()
#注:写操作只能写和追加,不能读,而且写操作:
1、文件不存在,会重新创建一个文件,
2、文件存在,会覆盖之前的文件中的内容

#############################

f = open("yesterday2","a",encoding="utf-8")
f.read("aaaaaaaaaaaa")
f.close()
#注:追加模式不可读,不存在则创建,存在则只追加内容
View Code

 

2、"+"号表示同时读写某个文件:

  • r+,可读写文件(可读;可写;可追加)          
  • w+,可写读文件(可读,可写,创建新文件)
  • a+,可追加和读文件(可读,可追加,不存在则创建)
f = open("yesterday","r+",encoding="utf-8")
f.write("\n666666")
print(f.read())
f.close()
 
#输出
Somehow, it seems the love I knew was always the most destructive kind
Yesterday when I was young
666666

#########################################

写读的功能是:创建新文件->写入文本->设置指针为开始位置(seek(0))->读取到文件内容

f = open("yesterday2","w+",encoding="utf-8")
print(f.read())
f.write("qigao zui lang\n")
f.seek(0)
print(f.read())
print(f.tell())
f.write("qigao zui lang\n")
f.seek(0)
print(f.read())
 
#输出
#第1次读的内容
 
#第二次读取的内容
qigao zui lang
 
#指针位置
16
#第三次读取的内容
qigao zui lang
qigao zui lang

#######################################

追加和读:追加读在写入文件时,不会清空之前的内容,而是在之前的内容的追加一行,读取文件内容,需要重新设置指针

f = open("yesterday2","a+",encoding="utf-8")
print("--------data1-----")
print(f.read())  #没有设置指针
print("--------data2-----")
f.seek(0)
print(f.read()) #设置指针
f.write("qigao zui lang\n")
print("---------data3----")
print(f.read())  #写完以后没有设置指针
print("--------data4-----")
f.seek(0)
print(f.read()) #写完以后设置指针
f.close()
 
#输出
 
--------data1-----
 
--------data2-----
And only now I'm left alone to end the play, yeah
qigao zui lang
qigao zui lang
 
---------data3----
 
--------data4-----
And only now I'm left alone to end the play, yeah
qigao zui lang
qigao zui lang
qigao zui lang
View Code

 注:

1、写读和追加功能,写入的行数不会收指针位置的控制,就是说不管指针在什么位置,依然写入的还是最后一行。

2、就是说当你,需要从开始读取文件内容的话,或者在某个位置之后的内容的话,需要设置指针位置,否则读取不到内容,代码如下:

f = open("yesterday2","w+",encoding="utf-8")
f.write("qigao zui lang\n")
print("-----不设指针位置-----")
print(f.read())
f.write("qigao zui lang\n")
print("-----设置指针位置-------")
f.seek(0)
print(f.read())
 
#输出
-----不设指针位置-----
 
-----设置指针位置-------
qigao zui lang
qigao zui lang
View Code

 

"U"表示在读取文件时,可以把\r\n自动转化为\n(与 r 或 r+ 模式同使用)

  • rU
  • r+U

3、"b"表示处理二进制文件

  • rb 二进制读
  • wb 二进制写
  • ab 二进制追加

这种是以二进制操作的,也就是说不管是是读,写,追加,都必须是二进制文件,也就是字节,而不是字符,需要解码以后才会生成字符。一般情况下跨平台的文件,视频文件等需要二进制模式 操作

#rb(二进制读)

#二进制读取
f = open("yesterday2","rb")
f_read = f.read()
print(f_read)
#解码
print(f_read.decode())
 
#输出
#没有解码,读出来的是二进制,也就是字节码
b'Somehow, it seems the love I knew was always the most destructive kind'
#解码后,是字符
Somehow, it seems the love I knew was always the most destructive kind

#####################################


# wb(二进制写)

f = open("yesterday2","wb")
in_str = "小高最帅"
 
#这边写入文件,就需要编码,否则就会报错
in_str = in_str.encode()
 
f.write(in_str)
f.close()

####################################


# ab(二进制追加)

f = open("yesterday2","ab")
in_str = "gaoge,shuai de yibi"
#这边需要先编码,才能追加到文件中
in_str = in_str.encode()
 
f.write(in_str)
f.close()
View Code

注:普通打开模式和二进制打开模式,只是在python 3中,二进制打开模式才做了字符和字节的编码和解码;然而在python 2中,字节和字符没有做明显的区别,所以在python 2中,二进制模式读取文件时,不需要做编码和转码的操作

 

三、with、读取文件对比:

1、with:

为了避免打开文件后忘记关闭,可以通过管理上下文,即:

with open('log','r') as f:
    pass

 如果打开多个文件会导致一行代码过长,(python官方建议,一行代码不超过80个字符),所以打开多个文件建议以下写法:

#with open('log1') as obj1, open('log2') as obj2:

with open('log1') as obj1, \
        open('log2') as obj2:
    pass

2、读取文件对比:

readline()

读取一行文件

f = open("yesterday","r",encoding="utf-8")
print(f.readline())
f.close()
#输出
Somehow, it seems the love I knew was always the most destructive kind

 readlines()

把文件中的每一行作为一个元素形成一个列表

f = open("yesterday2","r",encoding="utf-8")
print(f.readlines())
f.close()
#输出
['Somehow, it seems the love I knew was always the most destructive kind\n','Yesterday when I was young\n']

我们正常循环读取文件中的每一行,如下:

f = open("yesterday2","r",encoding="utf-8")
for line in f.readlines():
    print(line.strip())
f.close()
#输出
Somehow, it seems the love I knew was always the most destructive kind
Yesterday when I was young

这种方法已经达到我们的目的了,可以顺利的读取每一行,但是,当我们遇到2G,20G,甚至200G的文件时,你这样读取会导致内存不够用,会使程序变的很慢,因为你的内存只有几个G,你把几十个G的数据放到内存,内存肯定是受不了的,所以这种方法只适合小文件,不适合大文件。我们于是就有下面这种方法,如下:

f = open("yesterday2",'r',encoding='utf-8')
#f文件变成迭代器
    for line in f:
        print(line.strip())
  f.close()
#输出结果
Somehow, it seems the love I knew was always the most destructive kind
Yesterday when I was young

这种写法的好处在于,读取文件时,是一行一行的读取,而且,读取一行删除一行,内存中只保留一行

 

四、文件操作的内置方法:

file 对象使用 open 函数来创建,下表列出了 file 对象常用的函数:

 

推荐阅读