python - 如何将多个csv文件聚集在一个文件目录中
问题描述
我有多个具有相同数据结构的 csv 文件
我想一次聚集每个 csv 文件
import os
import pandas as pd
import numpy as np
from sklearn import metrics
import glob
df = pd.read_csv('File 000rejoice-19.csv')
can=df.drop(columns =['pat'])
from sklearn.cluster import DBSCAN
dbscan=DBSCAN(eps=3,min_samples=4)
X = can.iloc[:, [1,2,3,4]].values
X.shape
model=dbscan.fit(X)
labels=model.labels_
sample_cores=np.zeros_like(labels,dtype=bool)
sample_cores[dbscan.core_sample_indices_]=True
n_clusters=len(set(labels))- (1 if -1 in labels else 0)
n_clusters
此代码仅适用于一个 csv 文件,我想一次聚集多个 csv 文件
解决方案
您可以迭代 csv 文件所在的文件夹:我在.
这里使用本地文件夹。
from os import listdir
from sklearn.cluster import DBSCAN
for file in listdir('.'):
pd.read_csv(file)
can=df.drop(columns =['pat'])
dbscan=DBSCAN(eps=3,min_samples=4)
X = can.iloc[:, [1,2,3,4]].values
X.shape
model=dbscan.fit(X)
labels=model.labels_
sample_cores=np.zeros_like(labels,dtype=bool)
sample_cores[dbscan.core_sample_indices_]=True
n_clusters=len(set(labels))- (1 if -1 in labels else 0)
print(file, n_clusters)
推荐阅读
- c# - 将接口序列化为 JsonResult
- laravel - 我可以使用 php artisan serve npm run watch 吗?
- python - Numpy 广播 3-d 矩阵和 1d 向量
- node.js - “npm outdated”和“npm outdated -g”没有显示任何内容,那么为什么我会收到这些弃用警告?
- angular - Angular & RxJs Poerators:如何用另一个可观察的请求(管道/mergeMap?)覆盖对象值
- r - 如何在 (ggplot2) 中叠加 Geom_Point 和 Geom_Boxplot
- c++ - 使用 fmt 链接错误:未定义对 `std::string fmt::v6::internal::grouping_impl 的引用
(fmt::v6::internal::locale_ref)' - mocking - 使用 Jest/Vuex 测试 Promise.all
- python - 如何在测试中检查我的打印语句?
- regex - 如何在perl中计算一行数字中的奇数?