python - Python:从多个 csv.gz 创建熊猫数据框,仅提取 von CSV 指定的列
问题描述
有几篇文章解释了如何遍历文件夹,或从给定的 zip 中提取所有(或:特定)文件,或从文件中的多个 CSV 创建 pandas 数据框。唉,我缺乏将所有这些代码片段组合成可行的东西的经验 - 有人可以帮助我吗?
我目前拥有的:
import gzip
import csv
import json
import pandas as pd
path =r'C:\\Users\\folder_with_zipped_files'
File_List= glob.glob(path + "/*.csv.gz")
frame = pd.DataFrame()
list_ = []
for file_ in File_List:
df = pd.read_csv(File_List, compression='gzip', header=0,sep=',', error_bad_lines=False)
collectfiles.append(df)
allfiles = pd.concat(collectfiles)
这会引发错误:
ValueError: Invalid file path or buffer object type: <class 'list'>
感谢一百万的任何建议和帮助-非常感谢!
解决方案
推荐阅读
- vb.net - 以编程方式使用 imagemagick 将图像的背景转换为透明
- awk - 如何使用 AWK 编辑特定行并按原样复制其余部分?
- javascript - JS 替换为正则表达式
- python-3.x - 将字符串列表转换为元组并在 postgres sql 中使用
- r - 在 mutate 语句中动态引用列名 - dplyr
- macos - 如何使用 ffmpeg 从 docker 容器访问内置网络摄像头?
- redis - Redis Pub/Sub 和 Redis Streams 有多相似?
- python - 如何检查熊猫系列中是否存在一组值(包括 nans)?
- c++ - 为什么我需要在成员初始化器列表中重复我的基类的模板参数?
- html - 在 Wordpress 标题菜单上添加图标