python - 无法读取镶木地板文件
问题描述
我现在正在为此烦恼。我是这个parquet
文件的新手,我遇到了很多问题。
OSError: Passed non-file path: \datasets\proj\train\train.parquet
每次尝试从中创建一个错误时,都会引发一个错误df
。
我试过这个:
pq.read_pandas(r'E:\datasets\proj\train\train.parquet').to_pandas()
和
od = pd.read_parquet(r'E:\datasets\proj\train\train.parquet', engine='pyarrow')
我还更改了数据集所在驱动器的驱动器号,它是一样的!
所有引擎都一样。
请帮忙!
解决方案
这可能是 Arrow 文件路径处理的问题。您可以改为传入一个已经打开的文件:
import pandas as pd
with open(r'E:\datasets\proj\train\train.parquet', 'rb') as f:
df = pd.read_parquet(f, engine='pyarrow')
推荐阅读
- javascript - JavaScript 输出返回未定义
- sql - 在 typeorm postgres 数据库中存储字符串数组
- javascript - NuxtJS:将多个参数传递给页面
- svelte - Svelte - 从组件脚本转发事件
- python - 熊猫中的 GroupBy 和饼图
- mysql - sql: 之前找到了一个别名(接近否)
- flutter - 让 Dart Devtools 在 Chrome 中打开
- javascript - 如何将字符串数据从jsp传递到javascript
- amazon-web-services - 通过 SDK 按需执行托管 AWS Config 规则
- php - PHP 删除折线之间的多余空格