python - 如何在没有目标值的情况下将训练和测试拆分作为单独的数据框?
问题描述
我只能将 scikit-learn 函数train_test_split
应用于具有训练数据和目标数据的两个数据帧。但是如何将我的数据帧(包括目标值)以 0.75 的比例拆分为训练数据帧和测试数据帧?我不想只选择占所有行的 75% 的前 n 行,我希望有随机选择train_test_split
,但在训练和测试数据中不应该有相同的行。
解决方案
这应该将您的数据框拆分为训练并使用您指定的比例进行测试
import pandas as pd
from sklearn.model_selection import train_test_split
df = pd.DataFrame({'numbers': [1, 2, 3, 4, 5], 'colors': ['red', 'white',
'blue', 'green', 'black']},
columns=['numbers', 'colors'])
training_dataset, test_dataset = train_test_split(df, train_size=0.75)
推荐阅读
- html - 背景图像超出行 < 768 px
- javascript - 使用三元运算符而不是 if/else?
- apache-kafka - 为什么 kafka 消费者会数百次消费相同的消息?
- ruby-on-rails - Rails:尝试添加搜索功能 - 不断收到“没有路线匹配”
- python - 如何部署使用 numpy 的 Django 站点
- javascript - 突出显示多个文本框
- reactjs - 如果修改了 innerHTML,则从状态中渲染变量将停止工作
- arm - STM32H7xx 尽可能快地切换 IO
- phpmyadmin - 自更新到 MAMP 5.0 后,PhpMyAdmin 无法正常工作
- kubernetes - 多主 K8s 集群推荐的证书策略是什么?