首页 > 解决方案 > 使用 Dataframe 时如何防止 TypeError

问题描述

我正在使用 Titanic 数据集,在将数据拆分为测试集和训练集后,当我找到训练集和测试集的平均值而不是整个数据集时,总是返回 TypeError。

data2 = pd.read_csv(r'C:\Users\HP\Desktop\Hash/titanic.csv', usecols=['age', 'fare', 'survived'])
X_train, X_test, y_train, y_test = train_test_split(
    data[['age', 'fare']],  # predictors
    data['survived'],  # target
    test_size=0.3,  # percentage of obs in test set
    random_state=0)  # seed to ensure reproducibility
median = X_train['age'].median() #Returns 28

但是当我尝试平均时我得到一个错误

mean = X_train['age'].mean()

我收到这个错误

TypeError: can only concatenate str (not "int") to str

标签: pythonpandasmachine-learning

解决方案


推荐阅读