python - pyarrow read_table 没有“镶木地板版本”参数
问题描述
使用 pyarrow 我可以编写 2.0 版的镶木地板文件。
pyarrow.parquet.write_table方法有参数'版本'。但是pyarrow.parquet.read_table方法没有参数“版本” 。似乎它只能读取 1.0 版的镶木地板文件。
如何使用 pyarrow 读取 2.0 版的 parquet 文件?
解决方案
pyarrow.parquet.read_table
可以自动读取为 Parquet 2.0 版编写的文件。无需设置参数,这可以通过读取给定 Parquet 文件的元数据来检测。
在您的具体情况下,由于您没有在问题中包含任何回溯,因此很难准确回答为什么读取似乎不起作用。
推荐阅读
- azure - 了解 Azure Active Directory (AD) 中的多租户
- api - 能够在用户接近目的地时自动发送推送通知
- java - 通过 Spark Operator 执行 Spark/Java 应用程序的 Dockerfile
- amazon-web-services - 在 AWS EKS 上重新创建 Kubernetes 部署,停机时间为 0
- ssh - ssh 似乎不尊重 ServerAliveInterval 选项
- c++ - 将虚函数从父类链接到子类时,目标文件中的链接错误 2001
- python - 为一组行分配一个值 pandas
- excel - 在 EXCEL 中使用 VBA 在活动行的末尾创建平均列
- authentication - 使用访问令牌检索会话 ID
- android - 如何在北极狐 3.1 中清除 android studio logcat?