首页 > 解决方案 > 带有 Sklearn 的 MNIST 数据集

问题描述

我在 MNIST 数据集上训练线性模型,但我只想训练一个数字,即 4。如何选择我的 X_test、X_train、y_test、y_train?

标签: pythonmnistsklearn-pandas

解决方案


如果你只需要识别 4s 是一个二元分类问题,那么你只需要创建一个新的目标变量:如果 class 为 4,则 Y=1,如果 class 不是 4,则 Y=0。

  • Train_X 将保持不变
  • Train_Y 将是您与 Train_X 相关的新目标变量
  • Test_X 将保持不变
  • Test_Y 将是您与 Test_X 相关的新目标变量。<\ul>

    数据会有点不平衡,但应该不是问题!


  • 推荐阅读