python-3.x - 如何在 python 的 S3 中从 pandas 数据帧写入镶木地板文件
问题描述
我有一个熊猫数据框。我想将此数据框写入 S3 中的镶木地板文件。我需要一个相同的示例代码。我试图用谷歌搜索它。但我无法获得有效的示例代码。
解决方案
供您参考,我有以下代码工作。
s3_url = 's3://bucket/folder/bucket.parquet.gzip'
df.to_parquet(s3_url, compression='gzip')
为了使用to_parquet
,您需要pyarrow
或被fastparquet
安装。此外,请确保您在文件夹中的config
和credentials
文件中有正确的信息。.aws
编辑:另外,s3fs
需要。见https://stackoverflow.com/a/54006942/1862909
推荐阅读
- google-cloud-platform - Dataproc 错误上的 Zepplin BigQuery 连接
- bash - 如何提取远程 VM 的操作系统版本并将其设置为远程 VM 上的环境变量,并在期望脚本中进一步使用?
- django - 如何使用 POST 请求从 Django 表单接收数据并在 Html 模板上呈现
- flutter - 为什么任何小部件都是无状态的?
- r - 我可以使用 Shiny observeEvent 观察哪些事件?
- android - 如何在打盹模式 8.0 Oreo 设备中获取 GPS 更新?
- angular - Angular 7+ 中的 ClassDefinition 有什么类似物吗?
- c# - 如何异步调用单个方法“n”次?
- html - 如何从 htmlelement (elementref) 获取子项宽度
- python - Python:如何使用用户定义的函数拟合模型