python - 无法将镶木地板文件读入 jupyter 笔记本
问题描述
我从 zeppelin 将 parquet 文件上传到 amazon s3,我想用 python 将它下载到 jupyter notebooks 中。
这是我在 scala 中的上传代码
myFile.write.parquet("s3://company/myFile")
这是我在python中的下载代码
import pandas
import pyarrow.parquet as pq
import s3fs
s3 = s3fs.S3FileSystem()
pandas_dataframe = pq.ParquetDataset('s3://company/myFile', filesystem=s3).read_pandas().to_pandas()
pandas_dataframe.to_csv("myFile.csv")
它给了我这个错误
ArrowNotImplementedError:尚不支持从 Parquet 文件中读取结构列表:key_value: list not null> not null
解决方案
推荐阅读
- cmake - pkg_check_modules 无法解析,因为依赖项没有 .pc 文件
- c# - 为什么这个 C# 代码没有按预期运行?
- c# - 构建用于生产的角度应用程序时未加载图像
- arrays - 我无法在我的 C++ 代码中找到导致分段错误的原因
- python - 从 setup.py 安装时,无法在 Google Colab 中导入 Tensorflow 2.2.0rc2
- python-3.x - 计算赚取特定金额作为利息的时间
- c - 结构有问题,字符串 anf gtkwidget
- ruby-on-rails - 将对象移动到 DEEP_ARCHIVE 的更便宜的方法
- elasticsearch - 将参数从 Airflow 传递到 Logstash
- java - How to use grpc Status Details in package io.grpc