python - 如何在 python 中打开 .snappy.parquet 文件?
问题描述
如何在 python 3.5 中打开 .snappy.parquet 文件?到目前为止,我使用了这段代码:
import numpy
import pyarrow
filename = "/Users/T/Desktop/data.snappy.parquet"
df = pyarrow.parquet.read_table(filename).to_pandas()
但是,它给出了这个错误:
AttributeError: module 'pyarrow' has no attribute 'compat'
PS我以这种方式安装了pyarrow:
pip install pyarrow
解决方案
我遇到了同样的问题,并按照https://github.com/dask/fastparquet/issues/366解决方案中提出的解决方案设法解决了这个问题。
1)使用 conda install 安装 python-snappy (由于某种原因使用 pip install,我无法下载它)
2) 添加 snappy_decompress 函数。
from fastparquet import ParquetFile
import snappy
def snappy_decompress(data, uncompressed_size):
return snappy.decompress(data)
pf = ParquetFile('filename') # filename includes .snappy.parquet extension
dff=pf.to_pandas()
推荐阅读
- html - 如何将 Bootstrap 卡行与底部对齐
- go - Go的sqlc是否支持join?
- python - Plotly:有没有办法让日期滑块成为面积图而不是折线图?
- reactjs - 反应我想用props传递的值改变颜色
- python - 我的 for 循环以错误的顺序打印
- angular - 从服务获取状态回调函数
- css - 如何在less中使用calc函数
- git - 更正 GitHub 中个人访问令牌的全局 git 配置
- r - 用两级ggplot2重新排列堆积条形图
- python - Pygame 碰撞脚本:AttributeError:“pygame.Rect”对象没有属性“rect”