一、文件
什么是文件
文件是操作系统提供给用户/应用程序操作硬盘的一种虚拟概念(接口)
为什么要用文件
用户/应用程序可以通过文件将数据永久保存到硬盘中,即操作文件就是操作硬盘。
用户/应用程序直接操作的是文件,对文件进行的所有操作都是在向操作系统发送系统调用,
然后再由操作系统将其转换成具体的硬盘操作
如何用文件
控制文件读写内容的模式:t和b
强调:t和b不能单独使用,必须跟r/w/a连用
t:文本 1.读写都是以str(Unicode)为单位的 2.文本文件 3.必须为open()指定encoding='utf-8'
b:二进制 / bytes 控制文件读写操作的模式: r:只读模式 w:只写模式 a:只追加写模式 +:r+、w+、a+
二、文件操作的基本流程
1. 打开文件,由应用程序向操作系统发起系统调用open(...),操作系统打开该文件,对应一块硬盘空间,并返回一个文件对象赋值给一个变量f f=open('a.txt','r',encoding='utf-8') #默认打开模式就为r 2. 调用文件对象下的读/写方法,会被操作系统转换为读/写硬盘的操作 data=f.read() 3. 向操作系统发起关闭文件的请求,回收系统资源 f.close()
windows路径分隔符问题
open('C:\a.txt\nb\c\d.txt')
解决方案一:推荐
open(r'C:\a.txt\nb\c\d.txt') r':取消转义字符的作用
解决方案二:
open('C:/a.txt/nb/c/d.txt')
open()
f=open(r'aaa/a.txt',mode='rt') # f的值是一种变量,占用的是应用程序的内存空间 print(f)
三、文件的操作模式
3.1 控制文件读写操作的模式
r(默认的):只读 w:只写 a:只追加写
案例一:r 模式的使用
r只读模式: 在文件不存在时则报错,文件存在文件内指针直接跳到文件开头 with open('a.txt',mode='r',encoding='utf-8') as f: res=f.read() # 会将文件的内容由硬盘全部读入内存,赋值给res 小练习:实现用户认证功能 inp_name=input('请输入你的名字: ').strip() inp_pwd=input('请输入你的密码: ').strip() with open(r'db.txt',mode='r',encoding='utf-8') as f: for line in f: # 把用户输入的名字与密码与读出内容做比对 u,p=line.strip('\n').split(':') if inp_name == u and inp_pwd == p: print('登录成功') break else: print('账号名或者密码错误')
案例二:w 模式的使用
w只写模式: 在文件不存在时会创建空文档,文件存在会清空文件,文件指针跑到文件开头 with open('b.txt',mode='w',encoding='utf-8') as f: f.write('你好\n') f.write('我好\n') f.write('大家好\n') f.write('111\n222\n333\n') #强调: 1 在文件不关闭的情况下,连续的写入,后写的内容一定跟在前写内容的后面 2 如果重新以w模式打开文件,则会清空文件内容
案例三:a 模式的使用
a只追加写模式: 在文件不存在时会创建空文档,文件存在会将文件指针直接移动到文件末尾 with open('c.txt',mode='a',encoding='utf-8') as f: f.write('44444\n') f.write('55555\n') 强调 w 模式与 a 模式的异同: 1 相同点:在打开的文件不关闭的情况下,连续的写入,新写的内容总会跟在前写的内容之后 2 不同点:以 a 模式重新打开文件,不会清空原文件内容,会将文件指针直接移动到文件末尾,新写的内容永远写在最后 小练习:实现注册功能: name=input('username>>>: ').strip() pwd=input('password>>>: ').strip() with open('db1.txt',mode='a',encoding='utf-8') as f: info='%s:%s\n' %(name,pwd) f.write(info)
案例四:+ 模式的使用(了解)
r+ w+ a+ :可读可写 在平时工作中,我们只单纯使用r/w/a,要么只读,要么只写,一般不用可读可写的模式 with open('yan.txt',mode='r+t',encoding='utf-8') as f: # print(f.read()) f.write('yan') with open('yan.txt',mode='w+t',encoding='utf-8') as f: f.write('yan\n') print(f.read()) with open('g.txt',mode='a+t',encoding='utf-8') as f: print(f.read()) f.write('yan\n') print(f.read())
四、控制文件读写内容的模式
大前提: tb模式均不能单独使用,必须与r/w/a之一结合使用 t(默认的):文本模式 1. 读写文件都是以字符串为单位的 2. 只能针对文本文件 3. 必须指定encoding参数 b:二进制模式: 1.读写文件都是以bytes/二进制为单位的 2. 可以针对所有文件 3. 一定不能指定encoding参数
案例一:t 模式的使用
t 模式:如果我们指定的文件打开模式为r/w/a,其实默认就是rt/wt/at with open('a.txt',mode='rt',encoding='utf-8') as f: res=f.read() print(type(res)) # 输出结果为:<class 'str'> with open('a.txt',mode='wt',encoding='utf-8') as f: s='abc' f.write(s) # 写入的也必须是字符串类型 强调:t 模式只能用于操作文本文件,无论读写,都应该以字符串为单位, 而存取硬盘本质都是二进制的形式,当指定 t 模式时, 内部帮我们做了编码与解码
案例二: b 模式的使用
b: 读写都是以二进制位单位 with open('1.mp4',mode='rb') as f: data=f.read() print(type(data)) # 输出结果为:<class 'bytes'> with open('a.txt',mode='wb') as f: msg="你好" res=msg.encode('utf-8') # res为bytes类型 f.write(res) # 在b模式下写入文件的只能是bytes类型 强调:b模式对比t模式 1、在操作纯文本文件方面t模式帮我们省去了编码与解码的环节,b模式则需要手动编码与解码,所以此时t模式更为方便 2、针对非文本文件(如图片、视频、音频等)只能使用b模式 小练习: 编写拷贝工具 src_file=input('源文件路径: ').strip() dst_file=input('目标文件路径: ').strip() with open(r'%s' %src_file,mode='rb') as read_f,open(r'%s' %dst_file,mode='wb') as write_f: for line in read_f: # print(line) write_f.write(line)
PS:部分博文参考:https://zhuanlan.zhihu.com/p/108808704
来源:https://www.cnblogs.com/x945669/p/12488451.html