python - 来自 s3 存储桶的 Pandas read_pickle
问题描述
我正在使用AWS EMR的Jupyter笔记本。
我能够做到这一点:
pd.read_csv("s3:\\mypath\\xyz.csv')
。
但是,如果我尝试打开这样的泡菜文件,pd.read_pickle("s3:\\mypath\\xyz.pkl")
我收到此错误:
[Errno 2] No such file or directory: 's3://pvarma1/users/users/candidate_users.pkl'
Traceback (most recent call last):
File "/usr/local/lib64/python2.7/site-packages/pandas/io/pickle.py", line 179, in read_pickle
return try_read(path)
File "/usr/local/lib64/python2.7/site-packages/pandas/io/pickle.py", line 177, in try_read
lambda f: pc.load(f, encoding=encoding, compat=True))
File "/usr/local/lib64/python2.7/site-packages/pandas/io/pickle.py", line 146, in read_wrapper
is_text=False)
File "/usr/local/lib64/python2.7/site-packages/pandas/io/common.py", line 421, in _get_handle
f = open(path_or_buf, mode)
IOError: [Errno 2] No such file or d
但是,我可以在同一条路径上看到xyz.csv
两者xyz.pkl
!任何人都可以帮忙吗?
解决方案
Pandasread_pickle
仅支持本地路径,与read_csv
. 所以你应该先把pickle文件复制到你的机器上,然后再用pandas读取它。
推荐阅读
- ios - 如何在不打开父应用程序的情况下使用 SwiftUI for Widget 添加点击事件和更新视图?
- python - 如何使用 Pyspark 根据条件从另一个表更新表的 Spark DataFrame 列值
- android - 谷歌应用操作审核流程的时间长度是多少?
- http - 上传视频的大小在服务器上为 0,即使视频有大小
- laravel - 是否有任何使用 Office 365 邮件发送邮件的 Laravel 软件包?
- javascript - 我应该使用什么来根据过滤器选择获取更新的计数?
- java - 用于数据库迁移的 MongoDB 'mongock'
- python - 在Python中获取参数中文件的目录路径
- matlab - Matlab 使用 parfor 时崩溃
- asp.net-core - dotnet-monitor 和 OpenTelemetry?