首页 > 解决方案 > 从压缩文件夹中的文件夹中读取 txt 文件作为 pandas 数据框

问题描述

我想读入一个 txt 文件,该文件位于压缩文件夹中的文件夹中,作为熊猫数据框。

我已经研究了如何读取 txt 文件以及如何从压缩文件夹中访问文件, 分别使用 pandas 从 txt 加载数据从 URL 下载返回的 Zip 文件

问题是我收到一条KeyError带有我的代码的消息。

我认为这是因为我的 txt 文件位于文件夹中的文件夹中?

谢谢你的帮助!

# MWE

import requests
import pandas as pd
from zipfile import ZipFile
from io import BytesIO


txt_raw = 'hcc-data.txt'
zip_raw = 'https://archive.ics.uci.edu/ml/machine-learning-databases/00423/hcc-survival.zip'

r = requests.get(zip_raw)
files = ZipFile(BytesIO(r.content))
df_raw = pd.read_csv(files.open(txt_raw), sep=",", header=None)


# ERROR
KeyError: "There is no item named 'hcc-data.txt' in the archive"

标签: pythonpandasdata-sciencezipfile

解决方案


您需要添加文件的完整路径:

txt_raw = 'hcc-survival/hcc-data.txt'

推荐阅读