首页 > 解决方案 > 如何一次计算指定坐标和二维 xarray 数据之间的欧几里得距离

问题描述

如何一次计算指定坐标和二维 xarray 数据之间的欧几里德距离(没有 for 循环)?

我写了以下代码。但是如果数据量变大,这个脚本就会显得很慢。如果没有 for 循环,我怎么能做同样的事情?

import math
import xarray as xr 
import numpy as np

#set the specified lat, lon
specific_lat = 15
specific_lon = 65

#create sample xarry data
lat = [0, 10, 20]
lon = [50, 60, 70, 80]

#sample data
test_data = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])

#to xarray
data_xarray = xr.DataArray(test_data, dims=("lat","lon"), coords={"lat":lat, "lon":lon})

#calculate distance
xarray_distance = data_xarray #copy
xarray_distance.data[:,:] = 0.0 #zero-reset

for lat in data_xarray.lat.data:
    for lon in data_xarray.lon.data:
        xarray_distance.loc[{"lat":lat,"lon":lon}] = math.sqrt((lat- spec_lat)**2 + (lon - spec_lon)**2)

print(xarray_distance)

#<xarray.DataArray (lat: 3, lon: 4)>
#array([[21, 15, 15, 21],
#       [15,  7,  7, 15],
#       [15,  7,  7, 15]])
#Coordinates:
#  * lat      (lat) int64 0 10 20
#  * lon      (lon) int64 50 60 70 80

标签: pythonpython-xarray

解决方案


首先,xarray_distance = data_xarray不复制对象。两个名称都将看到相同的对象以及发生在该对象上的任何更改。对于副本,您想做data_xarray.copy().

现在,您希望利用 numpy 的矢量化和广播来一次性创建 2D 数组并将其设置为 xarray 的对象数据,而不是使用循环。

lat = np.array(lat)
lon = np.array(lon)
xarray_distance.data = np.sqrt((lat - spec_lat)[:,None]**2 + ((lon - spec_lon)**2))

结果

<xarray.DataArray (lat: 3, lon: 4)>
array([[21.21320344, 15.8113883 , 15.8113883 , 21.21320344],
       [15.8113883 ,  7.07106781,  7.07106781, 15.8113883 ],
       [15.8113883 ,  7.07106781,  7.07106781, 15.8113883 ]])
Coordinates:
  * lat      (lat) int32 0 10 20
  * lon      (lon) int32 50 60 70 80

您会注意到数据是浮点数,考虑到它们所代表的内容,它们可能应该是浮点数。如果您希望它们在数据的原始类型中,请替换

xarray_distance.data = np.sqrt(...)

xarray_distance.data = np.sqrt(...).astype(xarray_distance.data.dtype)

推荐阅读