python - 如何使用 sckit-learn 进行多种分类
问题描述
我正在尝试对一些数据进行分类以提供基于观察聚类的预测。我还是新手,一直在网上浏览示例,并且在尝试使用 python 实现自己时遇到了障碍。我有一个包含 5 列数据的文件,但我只关心 3 列如何交互。E 列是 0=否 1= 是 我想做的是看看 AB 和 E 之间是否存在相关性。如果 A 是 0 而 B 在 0-15 之间,看看它是否(0)的可能性有多大。当然,我的数据集比这大得多。对示例或来源的参考表示赞赏。
我一直使用 Iris 数据集示例作为模板,但在调整时出错。以下是我一直在使用的:
df = pd.read_csv('file.csv',)
df = pd.DataFrame (df,columns= ['A','B','C','D','E'])
df.tail()
X = df.iloc[0:50000, [0, 4]].values
X[0:78209]
y = df.iloc[0:50000, 4].values
y = np.where(y == 0, 0, 1)
y[0:5]
plt.scatter(X[:5000, 0], X[:5000, 1],alpha=0.5, c='b', edgecolors='none', label='No%2s'%(y[0]))
plt.scatter(X[5000:10000, 0], X[5000:10000, 1],alpha=0.5, c='r', edgecolors='none', label='Yes%2s'%(y[50]))
plt.xlabel('No')
plt.ylabel('Yes')
plt.legend(loc='lower right')
plt.show()
解决方案
推荐阅读
- serilog - Serilog忽略restrictedToMinimumlevel
- stan - What does the colon mean in Stan?
- python - Importing Pylot causes "invalid syntax" error in flask.py
- firefox - FireFox 62.0、46.0、47.0 等中的 RTCPeerConnection“未定义”
- python - TensorFlow Odeint
- c - 如何将数组从 .Net 传递到 C?
- javascript - 无法使用 ng-Change 实现 ctrl + 单击以在 FireFox 的新选项卡中打开
- python - 多个文件路径的正则表达式
- mysql - Can table columns be used to compare with results from aggregate functions using HAVING Clause?
- c# - CIL 类和方法的命名规则是什么