pickle 更快的数据储存方式

爬虫俱乐部 · 公众号 · · 2018-06-19 10:15

正文

请到「今天看啥」查看全文

) as f:
for name in classlist:
f.write(name+ '\n' )

通过使用读写函数，我们将该列表的内容分行写入一个名为 classlist 的列表中。当下次使用时再分行读入。

但python存在着专门读写python对象的方法，那就是 pickle 模块，用于解决对象的序列化与反序列化。所谓 序列化 指的是将python的对象转化为一种专门的二进制字符串，并将其以二进制形式写入一个文件中，而 反序列化 则是读取该二进制文件并将其转化回对象本身。这样子做有什么好处呢？最显而易见的是它的存储与读写速度会非常的快，后面我们会给出示例说明。其次创立专门的对象数据文件，可以防止数据被不小心修改，产生问题。

pickle模块在标准库内，引入pickle模块很简便。

import pickle

pickle dump

将对象转化为二进制存储文件使用的是pickle模块的 dump 方法，现在我们将一个长度为 100 的列表序列化并保存。

import random
import pickle

a = [random.random() for x in range(100)]

with open("alist.pkl",'wb') as f:
     pickle.dump(a,f)

可以看到，与一般的文件读写不同的是，我们的读写方式为 wb ，也就是二进制方式书写， pickle.dump 方法接收两个必需的参数，第一个是要序列化的对象，第二个是二进制文件句柄。执行完毕后，当前工作目录会多出来一个名为 alist.pkl 的文件，需要说明的是，pkl只是一个形式上的后缀名，你可以写成任何其它字符，但为了显示它是一个pickle序列化的数据对象，我们使用 pkl 作为标记。

pickle load

有读入就会有读取，将pkl文件读取为对象使用的是pickle模块的dump方法，现在我们将刚刚存储的数据文件读取

with open("alist.pkl",'rb') as f:
     abak = pickle.load(f)

通过这个样子即可反序列化pkl文件，变成python的列表对象。

更快的速度与更小的体积

请到「今天看啥」查看全文

推荐文章

三峡小微 · 高风速潮汐带上的绿色电站

3 小时前

三峡小微 · 三峡集团党组学习贯彻习近平总书记近期重要讲话重要指示批示精神

昨天

三峡小微 · 十秒扎根一棵树一键灌溉万亩沙

昨天

三峡小微 · @党员干部这些饭，吃不得！

2 天前

三峡小微 · 三峡水库成功实施库尾减淤调度保障防洪库容安全

2 天前

圈内扒爷 · 钟汉良竟然玩起了羞耻play！捏下巴强吻简直了……

8 年前

英文悦读 · 做听力时为什么所有单词都认识，但还是不能完全听懂？

8 年前

水木文摘 · 放不下，就记着；舍不得，就留着

8 年前

阅尽天下沧桑 · 新型传销来了！所有人都要冷静，不然会倾家荡产！

8 年前

中国金融四十人论坛 · 都在讲去杠杆，现在的杠杆率计算方式到底科学吗？

7 年前