python - 如何根据类拆分机器学习数据?
问题描述
我正在尝试根据 Y_train 的不同类别来拆分 (X_train, Y_train)。X_train 由 50,000 个 25 X 25 图像组成,Y_train 由 50,000 个二进制分类(0 或 1)组成。我试图用下面的代码放置数据
def split(X_train, Y_train):
if Y_train == 0:
0_only = []
0_only.append(X_train)
解决方案
这可能会做你想做的事:
# Find the indices of the samples in Y_train that are zero
idx_zero = np.where(Y_train == 0)[0]
# Get subset of X_train and Y_train where Y_train is zero
X_train_zero = X_train[idx_zero]
Y_train_zero = Y_train[idx_zero]
然后你可以用np.where(Y_train == 1)[0]
.
推荐阅读
- magento - 有没有办法在侧边栏中添加主导航的一部分?
- javascript - Angular:一个formControlName中的多个字段,反应形式
- date - 使用 awk 和日期在一行中更改文本文件的 gmt
- web2py - web2py如何在另一个动作/视图上链接网格
- python - 如何释放分配给嵌套 numpy 数组的内存?
- php - 如何防止通过双击提交
- linux - 在 FFMPEG 中选择出站 IP(eth0 或 eth1)
- c++ - 为什么在以下示例中我需要在 block_cache.h 之前包含 block_cache_key.h 和 block.h?
- java - 将Java中的二进制文件读取到特定的“%%EOF”标记?
- php - check id in all tables have the prefix table_