python - python - pandas python中数据帧的随机行会带来不同的回归结果?
问题描述
我试图在数据框中随机化我的行 - 应用线性回归之前的数据,但我意识到回归结果在行被随机化后会有所不同,这不应该是这种情况吗?我尝试使用的代码:
Without row randomisation:
data
X = data[feature_col]
y = data['median_price']
lr = LinearRegression()
lr.fit(X, y)
With row randomisation:
Method 1:
data = data.sample(frac=1)
Method 2:
data = data.sample(frac=1, axis=1)
Method 3:
from sklearn.utils import shuffle
data = shuffle(data)
Method 4:
data = data.sample(frac=1, axis=1).reset_index(drop=True)
在我尝试过的 4 行随机化方法中,只有方法 4 给出了与未应用随机化的结果相同的结果。我认为行随机化无论如何都不会影响回归结果?
解决方案
方法2和4是一样的吗?
如果您将相同类型的回归应用于相同的数据(随机或非随机),则回归结果不应有所不同。您应该使用axis = 0
随机化数据帧行,axis = 1
随机化列。
推荐阅读
- amazon-web-services - CDK Lambda 和 S3 工件循环依赖
- css - 如何确保我的 CSS 样式正确应用于从数组映射的项目
- python - 在 Python 中比较列表的匹配元素
- python - 找到具有缩放和非缩放数据的最佳集群数量的问题
- c# - 如何让机器人明白我在网络聊天中说印地语
- c# - 绑定到过滤后的可观察集合
- regex - grep 没有显示不可打印的分隔符
- amazon-web-services - AWS BATCH - 如何运行更多并发作业
- unity3d - Unity 角色控制器使用 W + A/D 键防止移动堆叠
- google-cloud-firestore - Firestore Security Get with a Where Query using Array Contains 产生权限被拒绝