首页 > 解决方案 > 如何将 scikit-learn 数据集写入 csv 文件

问题描述

scikit-learn我可以使用加载数据集

from sklearn import datasets
data = datasets.load_boston()
print(data)

我想做的是将此数据集写入平面文件(.csv

使用该open()功能,

f = open('boston.txt', 'w')
f.write(str(data))

有效,但包括数据集的描述。

我想知道是否有某种方法可以.csv从这个 Bunch 对象生成一个简单的带有标题的标题,以便我可以移动它并在其他地方使用它。

标签: pythonpandasscikit-learn

解决方案


data = datasets.load_boston()将生成字典。为了将数据写入.csv文件,您需要实际数据data['data']和列data['feature_names']。您可以使用这些来生成熊猫数据框,然后使用to_csv()它们将数据写入文件:

from sklearn import datasets
import pandas as pd 

data = datasets.load_boston()
print(data)

df = pd.DataFrame(data=data['data'], columns = data['feature_names'])
df.to_csv('boston.txt', sep = ',', index = False)

输出boston.txt应该是:

CRIM,ZN,INDUS,CHAS,NOX,RM,AGE,DIS,RAD,TAX,PTRATIO,B,LSTAT
0.00632,18.0,2.31,0.0,0.538,6.575,65.2,4.09,1.0,296.0,15.3,396.9,4.98
0.02731,0.0,7.07,0.0,0.469,6.421,78.9,4.9671,2.0,242.0,17.8,396.9,9.14
0.02729,0.0,7.07,0.0,0.469,7.185,61.1,4.9671,2.0,242.0,17.8,392.83,4.03
...

推荐阅读