首页 > 解决方案 > 附加两个数据框并创建一个新的

问题描述

我已经为 Kaggle 上的(旧)比赛制作了一个简单的模型,对其进行拟合、预测和评分。现在我想提交一个。

我已经删除了任何我认为没有必要解决这个问题的代码:

sample_sub = pd.read_csv('../input/web-traffic-time-series-forecasting/sample_submission_1.csv.zip')

key_1 = pd.read_csv('../input/web-traffic-time-series-forecasting/key_1.csv.zip')

pages_and_id = sample_sub.append(key_1, ignore_index=True)

pages_and_id.drop('Page', axis=1, inplace=True)

pages_and_id.fillna(0)

pages_and_id.drop_duplicates(inplace=True)

submission = pd.DataFrame(index=pages_and_id['Id'], data=predictions, columns=pages_and_id['Visits']) #predictions is simply the variable made earlier, when predicting on the model

最后一行导致此错误:

ValueError:传递值的形状为 (36266, 182),索引暗示 (17407560, 17407560)

链接到 kaggle 上的原始作业:https ://www.kaggle.com/c/web-traffic-time-series-forecasting/overview

标签: pythonpandas

解决方案


推荐阅读