首页 > 解决方案 > 如何使用 sckit-learn 进行多种分类

问题描述

我正在尝试对一些数据进行分类以提供基于观察聚类的预测。我还是新手,一直在网上浏览示例,并且在尝试使用 python 实现自己时遇到了障碍。我有一个包含 5 列数据的文件,但我只关心 3 列如何交互。E 列是 0=否 1= 是 我想做的是看看 AB 和 E 之间是否存在相关性。如果 A 是 0 而 B 在 0-15 之间,看看它是否(0)的可能性有多大。当然,我的数据集比这大得多。对示例或来源的参考表示赞赏。

数据看起来如何

我一直使用 Iris 数据集示例作为模板,但在调整时出错。以下是我一直在使用的:

df = pd.read_csv('file.csv',)
df = pd.DataFrame (df,columns= ['A','B','C','D','E'])
df.tail()

X = df.iloc[0:50000, [0, 4]].values

X[0:78209]

y = df.iloc[0:50000, 4].values
y = np.where(y == 0, 0, 1)
y[0:5]
plt.scatter(X[:5000, 0], X[:5000, 1],alpha=0.5, c='b', edgecolors='none', label='No%2s'%(y[0]))
plt.scatter(X[5000:10000, 0], X[5000:10000, 1],alpha=0.5, c='r', edgecolors='none', label='Yes%2s'%(y[50]))

plt.xlabel('No')
plt.ylabel('Yes')
plt.legend(loc='lower right')

plt.show()

标签: pythonmachine-learningjupyter-notebookclassification

解决方案


推荐阅读