拿下 Python中的文件操作
Python视频教程栏目介绍相关文件操作。
任何语言都离不开对文件的操作,那么Python语言是如何来操作和管理文件的。
编码方式
编码方式的历史大致为ASCII
->gb2312
->unicode
->utf-8
,期间具体详细信息可以百度
来个编码解码的小例子先,记住中文可以进行GBK
和utf-8
编码,在GBk
一个中文字符对应两个字节,在utf-8
一个中文字符对应三个字节,中文不能进行ASCII
编码。
>>> '刘润森'.encode('GBK') b'\xc1\xf5\xc8\xf3\xc9\xad' >>> '刘润森'.encode('ascii') Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128) >>> 'Runsen'.encode('ascii') b'Runsen' >>> "刘润森".encode('utf-8') b'\xe5\x88\x98\xe6\xb6\xa6\xe6\xa3\xae' >>> '刘润森'.encode('GBK').decode('GBK') '刘润森' >>> '刘润森'.encode('GBK').decode('utf-8') UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc1 in position 0: invalid start byte复制代码
如果编码解码格式不一致可能会出现乱码,encode表示编码,decode表示解码。
文件操作的API
下面是Python文件操作的具体的API。
方法 | 含义 |
---|---|
open | 打开 |
read | 读取 |
write | 写入 |
close | 关闭 |
readline | 单行读取 |
readlines | 多行读取 |
seek | 文件指针操作 |
tell | 读取当前指针位置 |
打开文件
Python的open()
函数打开一个文件时,有若干个参数可用。然而,最常用的参数只有前两个。
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
注意,第一个是强制性的,其余的是可选的。如果不添加mode参数,文件将在Python中以只读模式打开。
encoding:可以不写。不写参数,默认的编码本是操作系统默认的编码本。windows默认gbk,linux默认utf-8,mac默认utf-8。
f=open('test.txt',encoding='utf-8') #打开文件 data=f.read() #读取文件 print(data) f.close() #关闭文件 复制代码
mode
mode | 含义 |
---|---|
r | 文本模式,读取 |
rb | 二进制模式,读取 |
w | 文本模式,写入 |
wb | 二进制模式,写入 |
a | 文本模式,追加 |
ab | 二进制模式,追加 |
+ | 可读可写 |
读取文件
代码中用到的文件文件操作的1.txt 文件内容如下:
关注《Python之王》公众号 作者:Runsen复制代码
readline(),使用该方法时,需要指定打开文件的模式为r或者r+;
readlines(),读取全部行.返回一个列表,列表中的每个元素是原文件的每一行。如果文件很大,占内存,容易崩盘。
# 打开文件进行读取 f = open("1.txt","r",encoding='utf-8') # 根据大小读取文件内容 print('输出来自 read() 方法\n',f.read(2048)) # 关闭文件 f.close() # 打开文件进行读写 f = open("1.txt","r+",encoding='utf-8') # 读取第2个字和第2行行的文件内容 print('输出来自 readline() 方法\n',f.readline(2)) print('输出来自 readlines() 方法\n',f.readlines(2)) # 关闭文件 f.close() # 打开文件进行读取和附加 f = open("1.txt","r",encoding='utf-8') # 打开文件进行读取和附加 print('输出来自 readlines() 方法\n',f.readlines()) # 关闭文件 f.close() # 输出如下 输出来自 read() 方法 关注《Python之王》公众号 作者:Runsen 输出来自 readline() 方法 关注 输出来自 readlines() 方法 ['《Python之王》公众号\n'] 输出来自 readlines() 方法 ['关注《Python之王》公众号\n', '作者:Runsen']复制代码
写入文件
下面只介绍清除写 w
和追加写 a
案例:将关注《Python之王》公众号
写入 test.txt 文件中
# mode=w 没有文件就创建,有就清除内容,小心使用 with open('test.txt', 'w', encoding='utf-8') as fb: fb.write('关注《Python之王》公众号\n') 复制代码
下面再将作者:Runsen
写入test.txt 文件中
with open('test.txt', 'w', encoding='utf-8') as fb: fb.write('作者:Runsen\n') 复制代码
运行后会发现之前写的关注《Python之王》公众号
内容修改为作者:Runsen
,因为 w模式会清除原文件内容,所以小心使用。只要使用了w,就要一次性写完。
追加写 a
案例:将静夜思这首诗追加到 test.txt 文件中
# mode=a 追加到文件的最后 with open('test.txt', 'a', encoding='utf-8') as fb: fb.write('关注《Python之王》公众号\n') with open('test.txt', 'a'encoding='utf-8') as fb: fb.write('作者:Runsen\n') 复制代码
指针操作
事物或资源都是以文件的形式存在,比如消息、共享内存、连接等,句柄可以理解为指向这些文件的指针。
句柄(handle)是一个来自编译原理的术语,指的是一个句子中最先被规约的部分,所以带有一个「句」字。
句柄的作用就是定位,两个APi还是tell和seek。
tell返回文件对象在文件中的当前位置,seek将文件对象移动到指定的位置,传入的参数是offset ,表示移动的偏移量。
下面通过示例对上述函数作进一步了解,如下所示:
with open('test.txt', 'rb+') as f: f.write(b'Runsen') # 文件对象位置 print(f.tell()) # 移动到文件的第四个字节 f.seek(3) # 读取一个字节,文件对象向后移动一位 print(f.read(1)) print(f.tell()) # whence 为可选参数,值为 0 表示从文件开头起算(默认值)、值为 1 表示使用当前文件位置、值为 2 表示使用文件末尾作为参考点 # 移动到倒数第二个字节 f.seek(-2, 2) print(f.tell()) print(f.read(1)) #输出如下 6 b's' 4 50 b'\r' 复制代码
上下文管理
我们会进行这样的操作:打开文件,读写,关闭文件。程序员经常会忘记关闭文件。上下文管理器可以在不需要文件的时候,自动关闭文件,使用with open即可。
# with context manager with open("new.txt", "w") as f: print(f.closed) f.write("Hello World!") print(f.closed) #输出如下 False True复制代码
如何批量读取多个文件
下面,批量读取某文件夹下的txt文件
file_list = ['1.txt', '2.txt', '3.txt','4.txt'] for path in file_list: with open(path, encoding='utf-8') as f: for line in f: print(line)复制代码
下面将批量读取文件夹下的txt文件的内容,合并内容到一个新文件5.txt中,具体实现的代码如下。
import os #获取目标文件夹的路径 filedir = os.getcwd()+'\\'+'\\txt' #获取当前文件夹中的文件名称列表 filenames = [] for i in os.listdir(filedir): if i.split(".")[-1] == 'txt': filenames.append(i) #打开当前目录下的5.txt文件,如果没有则创建 f = open('5.txt','w') #先遍历文件名 for filename in filenames: filepath = filedir+'\\'+filename #遍历单个文件,读取行数 for line in open(filepath,encoding='utf-8'): f.writelines(line) f.write('\n') #关闭文件 f.close()复制代码
其实在Window中只需要cd 至目标文件夹,即你需要将所有想要合并的txt文件添加至目标文件夹中,执行如下DOS命令 type *.txt > C:\目标路径\合并后的文件名.txt
练习
题目:创建文件data.txt,文件共100000行,每行存放一个1~100之间的整数,题目来源:牛客
import random f = open(‘data.txt’,‘w+’) for i in range(100000): f.write(str(random.randint(1,100)) + ‘\n’) f.seek(0) print(f.read()) f.close()复制代码
题目:生成100个MAC地址并写入文件中,MAC地址前6位(16进制)为01-AF-3B,题目来源:牛客
import random import string def create_mac(): MAC='01-AF-3B' hex_num =string.hexdigits #0123456789abcdefABCDEF for i in range(3): n = random.sample(hex_num,2) sn = '-' + ''.join(n).upper() MAC += sn return MAC def main(): with open('mac.txt','w') as f: for i in range(100): mac = create_mac() print(mac) f.write(mac+'\n') main()复制代码
相关免费学习推荐:python视频教程
以上是拿下 Python中的文件操作的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

PHP主要是过程式编程,但也支持面向对象编程(OOP);Python支持多种范式,包括OOP、函数式和过程式编程。PHP适合web开发,Python适用于多种应用,如数据分析和机器学习。

PHP适合网页开发和快速原型开发,Python适用于数据科学和机器学习。1.PHP用于动态网页开发,语法简单,适合快速开发。2.Python语法简洁,适用于多领域,库生态系统强大。

在 Sublime Text 中运行 Python 代码,需先安装 Python 插件,再创建 .py 文件并编写代码,最后按 Ctrl B 运行代码,输出会在控制台中显示。

PHP起源于1994年,由RasmusLerdorf开发,最初用于跟踪网站访问者,逐渐演变为服务器端脚本语言,广泛应用于网页开发。Python由GuidovanRossum于1980年代末开发,1991年首次发布,强调代码可读性和简洁性,适用于科学计算、数据分析等领域。

Python更适合初学者,学习曲线平缓,语法简洁;JavaScript适合前端开发,学习曲线较陡,语法灵活。1.Python语法直观,适用于数据科学和后端开发。2.JavaScript灵活,广泛用于前端和服务器端编程。

Golang在性能和可扩展性方面优于Python。1)Golang的编译型特性和高效并发模型使其在高并发场景下表现出色。2)Python作为解释型语言,执行速度较慢,但通过工具如Cython可优化性能。

在 Visual Studio Code(VSCode)中编写代码简单易行,只需安装 VSCode、创建项目、选择语言、创建文件、编写代码、保存并运行即可。VSCode 的优点包括跨平台、免费开源、强大功能、扩展丰富,以及轻量快速。

在 Notepad 中运行 Python 代码需要安装 Python 可执行文件和 NppExec 插件。安装 Python 并为其添加 PATH 后,在 NppExec 插件中配置命令为“python”、参数为“{CURRENT_DIRECTORY}{FILE_NAME}”,即可在 Notepad 中通过快捷键“F6”运行 Python 代码。
