首页 > Python基础应用 > Python3 CookBook中文版 > 5.8 固定大小记录的文件迭代

5.8 固定大小记录的文件迭代

问题

你想在一个固定长度记录或者数据块的集合上迭代,而不是在一个文件中一行一行的迭代。

解决方案

通过下面这个小技巧使用 iterfunctools.partial() 函数:

from functools import partial

RECORD_SIZE = 32

with open('somefile.data', 'rb') as f:
    records = iter(partial(f.read, RECORD_SIZE), b'')
    for r in records:
        ...

这个例子中的 records
对象是一个可迭代对象,它会不断的产生固定大小的数据块,直到文件末尾。
要注意的是如果总记录大小不是块大小的整数倍的话,最后一个返回元素的字节数会比期望值少。

讨论

iter()
函数有一个鲜为人知的特性就是,如果你给它传递一个可调用对象和一个标记值,它会创建一个迭代器。
这个迭代器会一直调用传入的可调用对象直到它返回标记值为止,这时候迭代终止。

在例子中, functools.partial
用来创建一个每次被调用时从文件中读取固定数目字节的可调用对象。 标记值
b'' 就是当到达文件结尾时的返回值。

最后再提一点,上面的例子中的文件时以二进制模式打开的。
如果是读取固定大小的记录,这通常是最普遍的情况。
而对于文本文件,一行一行的读取(默认的迭代行为)更普遍点。

本文来自互联网用户投稿,不拥有所有权,该文观点仅代表作者本人,不代表本站立场。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,邮箱:80764001@qq.com,予以删除。
© 2023 PV138 · 站点地图 · 免责声明 · 联系我们 · 问题反馈