python - 将标签和数据从 csv 加载到 sklearn
问题描述
我有一个 csv 文件,其中包含几行分类/标签,后跟与它们相关的数据:
cat, 0, 1, 45, 23, ...
dog, 1, 5, 75, 23, ...
cat, 3, 4, 63, 24, ...
cat, 0, 1, 44, 23, ...
dog, 7, 3, 25, 4, ...
如何将 csv 文件加载到 sklearn?
编辑:还是我需要用数字等价物替换标签?即狗 = 1,猫 = 2,等等。
解决方案
* 根据 Vivek 的评论编辑
你可以使用熊猫。这是将数据输入简单随机森林分类器的示例:
import pandas as pd
from sklearn.ensemble import RandomForestClassifier
data = pd.read_csv('/path/to/data')
Y = data[[0]] # labels
X = data.drop([0], axis = 1) # features
clf = RandomForestClassifier()
clf.fit(X, Y)
推荐阅读
- oracle - 使用 GCP Dataflow 束作业和 python sdk 从 Oracle 数据库中提取数据
- c# - 升级 NuGet 包 (.Net Framework) 时,并非所有程序集引用都在更新
- r - 如何管理 .Rmd 文件中的块,例如突出显示代码块并显示块管理片段?
- python - YAML 管道无法将带有特殊字符的输入参数解析为 Python 任务
- java - Gson 和泛型映射
- unity3d - 如何统一替换“.hasChanged”
- javascript - 将文本添加到画布中的输入元素
- python - 有没有办法告诉 `spack env activate` 只通过文件系统带来 python 包?
- javascript - 用一定数量的单词包裹 javascript 文本
- seo - 如何在 Firebase 中为特定 URL 提供 410 状态代码?