python - 如何使用 Python 合并来自多个 CSV 文件的列
问题描述
可能这个问题的答案是可用的,但我无法得到正确的解决方案,因此我正在寻找完美的解决方案。假设我有多个 CSV 文件(大约 1500 个),其中包含单列和一些时间序列数据(10,000 次或行)。所有 CSV 文件中的列标题名称都相同。假设我有 CSV 文件,例如:
aa1.csv aa2.csv: aa3.csv:............aa1500.csv:
datavalue datavalue datavalue datavalue
4 1 1 2
2 3 6 4
3 3 3 8
4 4 8 9
I want the output like this:
datavalue,datavalue,datavalue,datavalue,.....datavalue
4,1,1,..2
2,3,6,..4
3,3,3,..8
4,4,8,..9
我的代码不起作用并提供其他内容:
import pandas as pd
import csv
import glob
import os
path 'F:/Work/'
files_in_dir = [f for f in os.listdir(path) if f.endswith('csv')]
for filenames in files_in_dir:
df = pd.read_csv(filenames)
df.to_csv('out.csv', mode='a')
如果有人可以提供帮助?
解决方案
您可以在 numpy 的帮助下尝试以下方式
import pandas as pd
import numpy as np
import os
path 'F:/Work/'
files_in_dir = [f for f in os.listdir(path) if f.endswith('csv')]
temp_data = []
for filenames in files_in_dir:
temp_data.append(np.loadtxt(filenames,dtype='str'))
temp_data = np.array(temp_data)
np.savetxt('out.csv',temp_data.transpose(),fmt='%s',delimiter=',')
推荐阅读
- python - How to add legend to Folium map created with GeoJson?
- amazon-web-services - AWS on Terraform - 如何避免“强制使用新资源”
- pycharm - 如何导入 PyCharm 设置?
- python - 我怎么能不重复猜测?
- performance - HMGET 与字段数和读取性能之间的相关性
- ruby - Ruby:将结构化文本转换为 csv 的脚本
- simulation - 如何将地图添加到一个模拟器?
- html - 基于设备的不同列数
- python - 在python dict中使用字符串值时如何避免KeyError
- c - 为什么我在输出后得到一些随机值?