python - 从数据透视表 pandas 中提取较小的表
解决方案
As suggested by @moys, can use train_test_split
from scikit-learn
after splitting your dataframe columns first for the non-overlapping column names.
Example:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
Generate data:
df = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD'))
Split df columns in some way, eg half:
cols = int(len(df.columns)/2)
df_A = df.iloc[:, 0:cols]
df_B = df.iloc[:, cols:]
Use train_test_split:
train_A, test_A = train_test_split(df_A, test_size=0.33)
train_B, test_B = train_test_split(df_B, test_size=0.33)
推荐阅读
- javascript - 如何通过 $http POST 发送数组数据并在 PHP 中解析相同的数据?
- elasticsearch - 我们可以限制数量吗?在弹性搜索中链接到别名的索引
- c# - 无法创建多个 ID,但我只有一个
- jupyter-notebook - 在 JupyterLab 中安装 Jupyter Notebook 扩展?
- java - Java Apache PDFBox - 加密不是确定性的
- cordova - 如何在科尔多瓦举办 aurelia
- parallel-processing - Julia - 并行化动画循环
- ios - 在滚动视图中切换具有不同高度的容器或视图
- c# - 作为事件处理程序的匿名方法
- python - django 表单验证 - 验证错误自定义消息不起作用