首页 > 解决方案 > 如何处理纬度和经度的 5 位或 6 位数字值?

问题描述

我正在尝试读取数据框,但纬度和经度似乎不准确。这不仅适用于几行,而且适用于超过 100k 行的整个数据框。

数据框截图

您如何处理此类数据?

标签: python-3.xpandasgeolocation

解决方案


看起来您的来源可能使用 99999 而不是 NaN。我会用 NaN 替换这些(缺失):

In [11]: df = pd.DataFrame([[1, 99999.0], [2, 4]], columns=['A', 'B'])

In [12]: df[['B']] = df[['B']].replace(99999., np.nan)

In [13]: df
Out[13]:
   A    B
0  1  NaN
1  2  4.0

IE

df[['Latitude', 'Longitude']] = df[['Latitude', 'Longitude']].replace(99999., np.nan)

注意:这可能会替换一些合法为 99999 的地理位置,但这不太可能!


推荐阅读