python - 如何将 scikit-learn 数据集写入 csv 文件
问题描述
scikit-learn
我可以使用加载数据集
from sklearn import datasets
data = datasets.load_boston()
print(data)
我想做的是将此数据集写入平面文件(.csv
)
使用该open()
功能,
f = open('boston.txt', 'w')
f.write(str(data))
有效,但包括数据集的描述。
我想知道是否有某种方法可以.csv
从这个 Bunch 对象生成一个简单的带有标题的标题,以便我可以移动它并在其他地方使用它。
解决方案
data = datasets.load_boston()
将生成字典。为了将数据写入.csv
文件,您需要实际数据data['data']
和列data['feature_names']
。您可以使用这些来生成熊猫数据框,然后使用to_csv()
它们将数据写入文件:
from sklearn import datasets
import pandas as pd
data = datasets.load_boston()
print(data)
df = pd.DataFrame(data=data['data'], columns = data['feature_names'])
df.to_csv('boston.txt', sep = ',', index = False)
输出boston.txt
应该是:
CRIM,ZN,INDUS,CHAS,NOX,RM,AGE,DIS,RAD,TAX,PTRATIO,B,LSTAT
0.00632,18.0,2.31,0.0,0.538,6.575,65.2,4.09,1.0,296.0,15.3,396.9,4.98
0.02731,0.0,7.07,0.0,0.469,6.421,78.9,4.9671,2.0,242.0,17.8,396.9,9.14
0.02729,0.0,7.07,0.0,0.469,7.185,61.1,4.9671,2.0,242.0,17.8,392.83,4.03
...
推荐阅读
- java - 更改 jtable 行颜色
- javascript - 在 Vue 中,是否可以允许用户创建路由器链接?
- java - 打印具有最大 Integer Key 的 HashMap String 值
- regex - 用于从绝对路径中提取文件夹名称的正则表达式(Linux)
- html - 实时服务器(与代码)扩展扩展了整个网页
- mysql - Sequelize - afterBulkUpdate() 如果更新与否如何获取
- python - 这段代码有什么问题?似乎没问题,但我的学校自动反馈说它无法运行
- c# - 如何在 C# 中使用 InTheHand.Net.Bluetooth 4.0.15 列出蓝牙客户端
- python - 根据 if 语句更改方法中的查询
- python - 关于 NN 类 - 模型不起作用并显示定义的类中存在错误