python - 如何使用python 2.7或更低版本读写parquet文件
问题描述
我想阅读 -> 更新 -> 使用 python 2.7 或更低版本编写镶木地板文件。面临与包裹相关的问题。请让我知道做同样事情的正确方法。
解决方案
您可以使用pyarrow
Python 2.7 读取 Parquet 文件,请参阅https://arrow.apache.org/docs/python/parquet.html请注意,没有适用于 Windows 的 Python 2.7 轮子。您要么需要在conda
那里使用,要么切换到 Linux / OSX。
阅读 Parquet 文件:
import pyarrow.parquet as pq
table = pq.read_table("file.parquet")
# Optionally convert to Pandas DataFrame
df = table.to_pandas()
编写 Parquet 文件:
import pyarrow as pa
import pyarrow.parquet as pq
# If your input data is a Pandas DataFrame, we need to convert it to an Arrow table first.
table = pa.Table.from_pandas(df)
pq.write_table(table, "filename.parquet")
推荐阅读
- c - 有符号整数和无符号整数
- image - R:将绘图从绘图窗口强制转换为光栅对象
- python - 如何在没有 Onehot 编码的情况下将行数据转换为列
- swagger - Swagger/OpenApi Codegen 从 xsd 生成请求正文
- javascript - 当存在多个选择框时,jquery select2选项冲突
- python - Pandas,在 groupby 调用中重命名重复列
- swift - 覆盖的方法快速调用扩展(类别)中声明的原始方法?
- python - 返回所有单词的正则表达式,星号之间的任何文本除外
- sql - 根据轮班时间计算总停机时间
- android - 我制作了一个嵌入网站的应用程序。如何使其中的任何视频能够处于全屏模式?