扣丁学堂Python培训简述pandas写入读取h5文件的方法

2019-08-28 11:15:00 3228浏览

本篇文章扣丁学堂Python培训小编给大家分享一篇对pandas写入读取h5文件的方法详解，文中有代码列出供读者们参考，小编觉得有不错的参考价值，希望对大家有所帮助。

1、前言

hdf5在存储的是支持压缩，使用的方式是blosc，这个是速度最快的也是pandas默认支持的。使用压缩可以提磁盘利用率，节省空间。开启压缩也没有什么劣势，只会慢一点点。压缩在小数据量的时候优势不明显，数据量大了才有优势。同时发现hdf读取文件的时候只能是一次写，写的时候可以append，可以put，但是写完成了之后关闭文件，就不能再写了，会覆盖。

2、写入文件

使用函数：pd.HDFStore

import numpy as np
import pandas as pd
####生成9000,0000条数据，9千万条
a = np.random.standard_normal((90000000,4))
b = pd.DataFrame(a)
####普通格式存储：
h5 = pd.HDFStore('/data/stock/test_s.h5','w')
h5['data'] = b
h5.close()

####压缩格式存储
h5 = pd.HDFStore('/data/stock/test_c4.h5','w', complevel=4, complib='blosc')
h5['data'] = b
h5.close()

3、读取文件

使用函数：pd.read_hdf

参数：文件名，key

data=pd.read_hdf('/data/stock/test_c4.h5',key='data')

最后想要了解更多关于Python和人工智能方面内容的小伙伴，请关注扣丁学堂Python培训官网、微信等平台，扣丁学堂IT职业在线学习教育平台为您提供权威的Python开发环境搭建视频，Python培训后的前景无限，行业薪资和未来的发展会越来越好的，扣丁学堂老师精心推出的Python视频教程定能让你快速掌握Python从入门到精通开发实战技能。扣丁学堂Python技术交流群：279521237。

扣丁学堂微信公众号 Python全栈开发爬虫人工智能机器学习数据分析免费公开课直播间

【关注微信公众号获取更多学习资料】【扫码进入Python全栈开发免费公开课】

查看更多关于"Python开发资讯"的相关文章>

标签: Python培训 Python视频教程 Python在线视频 Python学习视频 Python培训班

上一篇扣丁学堂Python培训简述Python计算库numpy进行方差/标准方差/样本标准方差/协方差的计算下一篇扣丁学堂Python培训简述pandas把数据写入txt文件每行固定写入一定数量的值方法

扣丁学堂Python培训简述pandas写入读取h5文件的方法

热门专区

课程推荐