python - 使用python创建新变量的问题
问题描述
我对 Python 很陌生,但有一个分析要做。
我从数据集 data_2015 和 data 2016 创建了一个新变量:
rfd_per_district_15 = data_2015[['Nom_Districte', 'Índex RFD Barcelona = 100']].groupby(['Nom_Districte'], as_index=False).sum()['Índex RFD Barcelona = 100']
rfd_per_district_16 = data_2016[['Nom_Districte', 'Índex RFD Barcelona = 100']].groupby(['Nom_Districte'], as_index=False).sum()['Índex RFD Barcelona = 100']
但结果却大不相同。'rfd_per_district_16' 完全按照我想要的方式出现。以浮点格式,所以我可以继续使用它
0 367.7
1 719.4
2 523.3
3 921.2
4 476.6
5 676.0
6 494.4
7 952.6
8 604.0
9 1054.8
Name: Índex RFD Barcelona = 100, dtype: float64
但是 'rfd_per_district_15' 的出现非常奇怪。就像来自多行的数据相互连接:
0 75.8108.576.696.4
1 104.895.8165.8128.9103.898.6
2 111.289.0114.4106.3103.0
3 90.488.182.795.256.974.593.572.392.689.380.9
4 124.5109.9250.5
6 65.061.448.851.155.955.647.855.454.035.647.134...
7 43.160.258.075.676.870.185.8
8 78.784.796.8150.295.6162.554.4102.868.357.5
9 74.336.970.483.282.274.377.088.2
10 151.7199.1214.1188.9205.1141.0
Name: Índex RFD Barcelona = 100, dtype: object
我看到了“rfd_per_district_15”作为对象类型出现的区别,但为什么呢?我不得不删除 'rfd_per_district_15' 中的索引 [5],因为有一些奇怪的值,但即使在该数据奇怪地出现之后(不是 rfd_per_district_16)。我只知道python的基础知识,所以真的不知道如何弄清楚......
解决方案
data_2015["Índex RFD Barcelona = 100"] = data_2015['Índex RFD Barcelona = 100'].astype('float')
使用此代码,我设法转换了列的类型。谢谢@sam
推荐阅读
- python - 烧瓶中的请求超时(408 状态码)
- python - Vagrant : RuntimeError: Python version >= 3.5 required
- javascript - 在子组件中发出事件时,对象未在父组件中接收
- json - 有没有办法在谷歌表格的 url 中引用单元格?
- google-apps-script - 在保留受保护范围的同时制作电子表格副本
- jqgrid - 未找到 jqGridImport 请求
- sql-server - 如何查询 sql 以获取最新的记录日期值
- mysql - 从子查询中选择具有相同名称的列
- python - 如何读取此列中的前 5 行并跳到第 n 行并再次读取接下来的 5 行,直到到达列数据的末尾?
- github - 用于团队代码管理的免费工具,例如 Github