首页 > 技术文章 > 文件操作

DT-BK 2019-08-21 06:35 原文

对文件的操作流程

  1. 打开文件,得到文件句柄并赋值给一个变量
  2. 通过句柄对文件进行操作
  3. 关闭文件

1、字符编码问题

首先,我们先前写好一个文件,并命名为“yesterday.txt”,内容如下:

Somehow, it seems the love I knew was always the most destructive kind
不知为何,我经历的爱情总是最具毁灭性的的那种
Yesterday when I was young
昨日当我年少轻狂
The taste of life was sweet
生命的滋味是甜的
As rain upon my tongue
就如舌尖上的雨露
I teased at life as if it were a foolish game
我戏弄生命 视其为愚蠢的游戏
The way the evening breeze
就如夜晚的微风
May tease the candle flame
逗弄蜡烛的火苗
The thousand dreams I dreamed
我曾千万次梦见
The splendid things I planned
那些我计划的绚丽蓝图
I always built to last on weak and shifting sand
但我总是将之建筑在易逝的流沙上
I lived by night and shunned the naked light of day
我夜夜笙歌 逃避白昼赤裸的阳光
And only now I see how the time ran away
事到如今我才看清岁月是如何匆匆流逝
Yesterday when I was young
昨日当我年少轻狂
So many lovely songs were waiting to be sung
有那么多甜美的曲儿等我歌唱
So many wild pleasures lay in store for me
有那么多肆意的快乐等我享受
And so much pain my eyes refused to see
还有那么多痛苦 我的双眼却视而不见
I ran so fast that time and youth at last ran out
我飞快地奔走 最终时光与青春消逝殆尽
I never stopped to think what life was all about
我从未停下脚步去思考生命的意义
And every conversation that I can now recall
如今回想起的所有对话
Concerned itself with me and nothing else at all
除了和我相关的 什么都记不得了
The game of love I played with arrogance and pride
我用自负和傲慢玩着爱情的游戏
And every flame I lit too quickly, quickly died
所有我点燃的火焰都熄灭得太快
The friends I made all somehow seemed to slip away
所有我交的朋友似乎都不知不觉地离开了
And only now I'm left alone to end the play, yeah
只剩我一个人在台上来结束这场闹剧
Oh, yesterday when I was young
噢 昨日当我年少轻狂
So many, many songs were waiting to be sung
有那么那么多甜美的曲儿等我歌唱
So many wild pleasures lay in store for me
有那么多肆意的快乐等我享受
And so much pain my eyes refused to see
还有那么多痛苦 我的双眼却视而不见
There are so many songs in me that won't be sung
我有太多歌曲永远不会被唱起
I feel the bitter taste of tears upon my tongue
我尝到了舌尖泪水的苦涩滋味
The time has come for me to pay for yesterday
终于到了付出代价的时间 为了昨日
When I was young
当我年少轻狂
View Code

上面的代码是想把“yesterday2”文件打开,把内容读出来,让后直接付给data,但是最后报了“

UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 105: illegal multibyte sequence

”错误,这个错误是编码错误,我用的是win10系统,它默认的是gbk编码的,而python是以‘UTF-8’编码的,所以它会报编码错误!

那对于此错误我们怎么修改呢?很简单,先上代码

1 data = open("yesterday.txt",encoding="utf-8").read()

 我们现在把data数据读出来,如下所示:

其实我们只是多加了encoding = 'UTF-8'  这句话就表示:我们指定比那吗格式为UTF-8,这样我们的问题就得到了解决!虽然这个问题得到了解决,但是新的问题又出现了:我们只能把整个文件一次性都读出来,不能对文件进行增删改查。前面我们说过,对文件的操作,是要对文件句柄进行操作,因此,我们要先把文件句柄,得到,并传给一个变量f:

1 f = open("yesterday2",encoding="utf-8")  # 文件句柄,文件的内存对象

我们有了文件的句柄之后,就可以对文件进行操作了:

1 f = open('yesterday2') #打开文件
2 first_line = f.readline()
3 print('first line:',first_line) #读一行
4 print('我是分隔线'.center(50,'-'))
5 data = f.read()# 读取剩下的所有内容,文件大时不要用
6 print(data) #打印文件
7  
8 f.close() #关闭文件

以上是对文件的一些基本操作。

 

其实打开文件的模式有很多种:

打开文件的模式有:

  • r,只读模式(默认)。
  • w,只写模式。【不可读;不存在则创建;存在则删除内容;】
  • a,追加模式。【可读;   不存在则创建;存在则只追加内容;】

"+" 表示可以同时读写某个文件

  • r+,可读写文件。【可读;可写;可追加】
  • w+,写读
  • a+,同a

"U"表示在读取时,可以将 \r \n \r\n自动转换成 \n (与 r 或 r+ 模式同使用)

  • rU
  • r+U

"b"表示处理二进制文件(如:FTP发送上传ISO镜像文件,linux可忽略,windows处理二进制文件时需标注)

  • rb
  • wb
  • ab

我们来解释几个操作:

1】读文件操作

1 f = open("yesterday2",'r',encoding='utf-8')
2 data = f.read()
3 print(data)
4 f.close()

‘r’,其实对于读,它是默认的,我们不写'r',也是可以进行读文件操作的。

2】写文件操作

1 f = open("yesterday.txt",'w',encoding="utf-8")
2 f.write("I love python!\n")

对于写文件,‘w’,我们要慎用,因为,‘w’它的含义是:首先新建一个“yesterday.txt”文件,然后在文件里面写内容,但是如果,此文件已经存在,那么它将覆盖原先的文件,原先文件里面的内容将全部被覆盖,所以,对此操作,我们因该慎用。

3】追加文件操作

1 f = open("yesterday.txt",'a',encoding="utf-8")
2 f.write("because python is very good!")

‘a’就是在文件的最后增加内容

4】关闭文件操作

1 f.close()

关闭文件操作就很简单了。

 

最后再讲一个文件指针

1】tell()

1 f = open("yesterday2",'r',encoding="utf-8")
2 print(f.tell())    # 光标所在位置,索引
3 print(f.readline().strip())
4 print(f.tell())

2】seek()

1 f = open("yesterday2",'r',encoding="utf-8")
2 print(f.tell())    # 光标所在位置,索引
3 print(f.readline().strip())
4 print(f.readline().strip())
5 print(f.tell())
6 f.seek(0) # 回到0下标
7 print(f.readline().strip())
8 print(f.tell())

 

 

 

 

推荐阅读