python - 我可以过滤镶木地板吗?
问题描述
我刚开始查看镶木地板文件,因为我的一些数据以这种格式可用。而且我以前没有真正玩过它,所以这是我的问题。
我像这样打开我的镶木地板文件:
import pyarrow.parquet as pq
table1 = pq.read_table('mydatafile.parquet')
该文件由 10 列组成。现在是否可以直接从这里过滤掉所有行,例如 column3 的值为 1?
我的意思是,我可以这样做:
df = table1.to_pandas()
df = df[df["column3"] != 1]
但这可以在本地完成,而无需先转换为 Pandas 数据框吗?
解决方案
您可以使用文档中的此语法
import pyarrow.parquet as pq
table1 = pq.read_table('mydatafile.parquet', filters = [('column3', '!=' , 1)])
来源:
推荐阅读
- powershell - 最后的 For each 循环不会产生任何输出 | 电源外壳
- list - scala spark减少groupby中的列表
- python - 错误:无法为使用 PEP 517 且无法直接安装的沙发底座构建轮子
- php - Laravel 通过属性获得雄辩的查询构建器关系
- javascript - 为什么我在 addClass 上收到控制台错误,但一切仍按预期工作?
- ssas - 关于 SSAS 和 MDX 的现任成员
- c# - 如何根据当前日期(以秒为单位)获取以秒为单位的开始日期
- node.js - 如何在静态类的嵌套节点中使用温斯顿记录器
- python-3.x - 在 PyInstaller 捆绑应用中请求摄像头访问权限
- ubuntu - 使用 ipaddress 访问在 127.0.0.1 上在 VM 中运行的网站,但每次打开新页面时它都会重置