[后如何读取]R如何读取数据

文件读取，在实际运用中，更多的是做文件的导入导处的操作。常用的方法也不多；如果项目是偏io方面，或者说是日志分析的项目，也许io读取是比较频繁的。

1 ，文件的读取

1）常用的读取操作

输出结果：四个以下相同的输出结果

要记住一点，要尽量用with open("path...") as f , 这样就不用手动close，默认会帮我们自动关闭操作的句柄。每一个读取都是一个线程，如果不关闭，总会耗费一些资源，所以不用with open("path...") as f ，就必须在使用完之后，手动关闭。

其次，f.readline() 在实际的操作使用会多一点，很多字符串的操作是按行操作来进行的，或者每次安装指定的字节大小读取文件，直到读取完为止。

2）读取指定的字节量

输出结果：

这里，我们用encoding='UFT-8',如果不这样就有可能会输出乱码，因为有逗号，句号是gbk编码的，需要做一个字符编码的解码。

f.read(10)是文件一次读取十个字符，一个汉字符占用3个字节，使用的逗号是gbk的，转为utf-8也是占用3个字符，所以共有30个字节。而f.tell() 告诉我们的就是所在的字节位置，第一个字节位置为0，那么31个字节的位置为30;

如果你们公司是做分布式下载或者多线程下载应用，可能会用到把文件进行切片，然后在合成一个大文件，其实，很多大数据的文件传输都是这么做的。它们通常都是先计算文件的大小，然后按切片大小切分文件，分线程进行传输，传输到目的网络，然后在进行切片组装成文件。使用的就是f.seek(offset,whence)来进行切片：

offset:是偏移量，whence:0 代表从文件的开始位置开始计算偏移量，1 代表从当前指针的位置计算偏移量（即文件读取到某字符的位置）,2 代表从文件结束的位置计算偏移量。例如上面的f.seek(207, 0)，读取50字符就：【是冰了。小熊一蹦三尺高，开心地想：“我可以去溜冰了。”于是，它兴冲冲的跑回了家，对妈妈说：“妈妈，我要】

获取文件的大小，可以用：os.

还有一个很重要的就是文件的读取模式：

上面已经用到'r',a+ 模式是最强大的，可读可写，可追加，如果文件不存在，还会自动创建文件，当然在用的时候一定要考虑用户的权限，不是任何人都可以调用的方法，应该有所限制，不然存在安全隐患。

2 ，文件的写入

这一块也就没有什么好讲，主要是要自己动动手，看看写入文件是不是你想要的。

shutil是一个自带的工具类，提供一些简便的操作方法，若是没有也可以自己实现，可以直接看看源代码去学习。

文件内容的比较可以去参考 difflib模块 SequenceMatcher 也是很强大的，可是用到的比较少。

3，文件的属性

输出结果：

os.stat 返回的是文件的所有状态；glob.glob是文件路径匹配，支持正则表达式，返回是目录下所有匹配的文件。其他，一看便懂，便不讲了。

4，目录的常见操作

输出结果：

os.mkdirs是创建多级目录，而os.mkdir只是创建单级目录。os.listdir(".") 返回是一个当前目录的列表；而os.walk 才是一个重头戏，返回的是递归后的所有文件，root表示父级路径，dirs表示文件名，files所有的文件名。要获取绝对路径，必须用：os.(root,filepath) 获取。

5，补充：Excel的读写操作

excel的读取

excel的写入

具体返回什么，那你们要在自己的电脑里创建文件，并做尝试了，这就不做深入分析了。

总结：

总结：感觉这章内容很多，其实不多，主要是读取部分，不外乎with open(XXX) as f ，接下按行读取或者写入即可。具体，一定要好好敲一遍代码，才有感觉。后面的扩展例子，操作excel也好好敲敲代码，也是十分好懂的。

“后如何读取,R如何读取数据,如何读取发票,如何读取光盘,如何读取文件”边界阅读

责任编辑: 鲁达

“后如何读取,R如何读取数据,如何读取发票,如何读取光盘,如何读取文件”边界阅读