首页 > 解决方案 > 如何使用熊猫数据框中的纬度和经度计算距离?

问题描述

我有一个数据框,它有两列纬度和经度,以及 863 行,因此每一行都有一个由纬度和经度定义的点坐标。现在我想以公里为单位计算所有行之间的距离。我正在使用以下参考链接来获取纬度和经度对之间的距离。如果有几行,我可以使用参考链接完成。但是我有大行,我认为我需要一个循环来解决问题。由于我是 python 新手,我无法创建循环这个想法的逻辑。

参考链接: 根据纬度/经度获取两点之间的距离

我的数据框如下所示:

read_randomly_generated_lat_lon.head(3)
Lat          Lon
43.937845   -97.905537
44.310739   -97.588820
44.914698   -99.003517

标签: python-3.xpandasgeolocationlatitude-longitude

解决方案


您可以使用 scikit-learn 做到这一点:

import numpy as np
from sklearn.neighbors import DistanceMetric

dfr = df.copy()
dfr.Lat = np.radians(df.Lat)
dfr.Lon = np.radians(df.Lon)
hs = DistanceMetric.get_metric("haversine")
(hs.pairwise(dfr)*6371) # Earth radius in km

输出:

array([[  0.        ,  48.56264446, 139.2836099 ],
       [ 48.56264446,   0.        , 130.57312786],
       [139.2836099 , 130.57312786,   0.        ]])

注意输出是一个方阵,其中元素 (i,j) 是第 i 行和第 j 行之间的距离

这似乎比使用带有自定义haversine函数的 scipy 的 pdist 更快


推荐阅读