首页 > 解决方案 > 在 python 中使用 train_test_split 将数据拆分为训练和测试时缺少一行

问题描述

我有一个包含 175270 行和 164 列的数据框。当我执行 train_test_split 时,缺少一行。我无法理解为什么 train_test_split 会出现这种奇怪的行为。

我从未在 train_test_split 中遇到过这种行为。请帮助我了解哪里出了问题。

# train_test_split code:
train1, test1 = train_test_split(df, train_size = 0.7, test_size = 0.3, random_state = 100)

我正在使用上面的代码行来拆分数据。但是在拆分数据时它缺少一行。train1 行是 122688。test1 行是 52581。总共我必须得到 175270,但我得到 175269。

标签: pythonscikit-learntrain-test-split

解决方案


推荐阅读