python - 如何从 url 加载压缩的机器学习数据集?
问题描述
我正在尝试从 url 加载压缩的、制表符分隔的“MHEALTHDATASET”。 https://archive.ics.uci.edu/ml/machine-learning-databases/00319/
代码:
zipurl = 'https://archive.ics.uci.edu/ml/machine-learning-databases/00319/MHEALTHDATASET.zip'
with urlopen(zipurl) as zipresp, NamedTemporaryFile() as tfile:
tfile.write(zipresp.read())
tfile.seek(0)
unpack_archive(tfile.name, '/tmp/MHEALTHDATASET.zip', format='zip')
dataset = np.loadtxt(urlopen(zipurl), dtype=str, delimiter="/t")
for file in dataset:
file = re.sub("mHealth_", "", file)
错误:
Traceback (most recent call last):
File "C:\Users\User\PycharmProjects\algorithms\elbow.py", line 17, in <module>
unpack_archive(tfile.name, '/tmp/MHEALTHDATASET.zip', format='zip')
File "C:\Program Files\WindowsApps\PythonSoftwareFoundation.Python.3.9_3.9.1520.0_x64__qbz5n2kfra8p0\lib\shutil.py", line 1247, in unpack_archive
func(filename, extract_dir, **dict(format_info[2]))
File "C:\Program Files\WindowsApps\PythonSoftwareFoundation.Python.3.9_3.9.1520.0_x64__qbz5n2kfra8p0\lib\shutil.py", line 1151, in _unpack_zipfile
raise ReadError("%s is not a zip file" % filename)
shutil.ReadError: C:\Users\User\AppData\Local\Temp\tmp_x_c1ejk is not a zip file
解决方案
推荐阅读
- javascript - 无法在 React 中使用百分比设置高度
- pandas - Panada groupby,然后应用函数来比较连续值(从下到上)以增加,要创建的新列说明真/假
- python - 未找到 Jupyter Notebook 内核错误 win32api
- python - /review/1 __init__() 处的 TypeError 得到了意外的关键字参数“id”。我正在创建一个在线图书买卖项目
- sockets - UDP 客户端工作,但没有收到来自客户端的响应
- php - 如何使用正则表达式获取价格值
- django - 我正在尝试在 django 中注册用户,但表单字段未显示。我的代码有什么问题?
- vba - 按日期测量收到 Outlook 电子邮件和回复之间的响应时间:从电子邮件返回 PR_RECEIVED_BY_ENTRYID 时出错
- python - django中不同模型的通用视图
- python - 检查两个 pyomo 表达式是否相同