首页 > 解决方案 > 使用python创建新变量的问题

问题描述

我对 Python 很陌生,但有一个分析要做。

我从数据集 data_2015 和 data 2016 创建了一个新变量:

rfd_per_district_15 = data_2015[['Nom_Districte', 'Índex RFD Barcelona = 100']].groupby(['Nom_Districte'], as_index=False).sum()['Índex RFD Barcelona = 100']
rfd_per_district_16 = data_2016[['Nom_Districte', 'Índex RFD Barcelona = 100']].groupby(['Nom_Districte'], as_index=False).sum()['Índex RFD Barcelona = 100']

但结果却大不相同。'rfd_per_district_16' 完全按照我想要的方式出现。以浮点格式,所以我可以继续使用它

0     367.7
1     719.4
2     523.3
3     921.2
4     476.6
5     676.0
6     494.4
7     952.6
8     604.0
9    1054.8
Name: Índex RFD Barcelona = 100, dtype: float64

但是 'rfd_per_district_15' 的出现非常奇怪。就像来自多行的数据相互连接:

0                                     75.8108.576.696.4
1                          104.895.8165.8128.9103.898.6
2                              111.289.0114.4106.3103.0
3          90.488.182.795.256.974.593.572.392.689.380.9
4                                       124.5109.9250.5
6     65.061.448.851.155.955.647.855.454.035.647.134...
7                          43.160.258.075.676.870.185.8
8           78.784.796.8150.295.6162.554.4102.868.357.5
9                      74.336.970.483.282.274.377.088.2
10                       151.7199.1214.1188.9205.1141.0
Name: Índex RFD Barcelona = 100, dtype: object

我看到了“rfd_per_district_15”作为对象类型出现的区别,但为什么呢?我不得不删除 'rfd_per_district_15' 中的索引 [5]​​,因为有一些奇怪的值,但即使在该数据奇怪地出现之后(不是 rfd_per_district_16)。我只知道python的基础知识,所以真的不知道如何弄清楚......

标签: python

解决方案


data_2015["Índex RFD Barcelona = 100"] = data_2015['Índex RFD Barcelona = 100'].astype('float')

使用此代码,我设法转换了列的类型。谢谢@sam


推荐阅读