首页 > 解决方案 > 在R中使用方括号的空间逆子集

问题描述

我有一个空间点数据框-> spatial_points

和一个多边形 - > spatial_poly

我可以使用多边形内的所有点进行子集化

subset_within <- spatial_points[spatial_poly,]  which is nice and intuitive.

但是如果我想对多边形外的所有点进行子集化,我就不能使用

subset_ouside <- spatial_points[-spatial_poly,]

之前有人问过这个问题,答案是gDifference()rgeos包中使用。美好的。

我的问题是,为什么 [ ] 适用于内部选择,而不是相反?我真的不明白错误信息

h(simpleError(msg, call)) 中的错误:在为函数“[”选择方法时评估参数“i”时出错:一元运算符的参数无效

只是好奇。谢谢。

编辑

这是从带有多边形的子集空间点借来的示例

require(rgeos)
require(sp)

##create spdf
coords=expand.grid(seq(150,151,0.1),seq(-31,-30,0.1))
spdf=data.frame("lng"=coords[,1],"lat"=coords[,2])
coordinates(spdf) = ~lng+lat
proj4string(spdf)<- CRS("+init=epsg:4326")
plot(spdf)

##create poly
poly1 = SpatialPolygons(list(Polygons(list(Polygon(cbind(c(150.45,150.45,150.75,150.75,150.45),c(-30.75,-30.45,-30.45,-30.75,-30.75)))),ID=1)))
proj4string(poly1)<- CRS("+init=epsg:4326")

##get points withing polygon
points_within <-spdf[poly1,]  # this works

plot(spdf)
plot(poly1, add=T)
plot(points_within,col="blue",pch=16,add=T)

##get points outside polygon
points_outside <-spdf[-poly1,]  # this does not work - why??

在这个简单的示例中,可以使用gDifference(),它在此示例中有效。但是,我的 SpatialPointDataframe 非常大,使用 gDifference 会使 R 崩溃。

标签: rspatialrgeo-shapefile

解决方案


当您df[2, 1]在 R 中执行此操作时,您实际上是在调用一个函数。功能是'['(df, 1, 2)。只是解析器对您隐藏了这一点,这使您可以以更自然的方式编写代码。

如果您考虑一下[,即使操作在概念上相似,运算符也会根据您使用的对象类型执行不同的操作。返回数值向量子集的实际代码与返回矩阵或列表子集的代码不同。事实上,在 R 中有一些对象调用[函数没有意义,也没有实现。例如,如果您尝试在函数名称上调用它:

print[1]
#> Error in print[1] : object of type 'closure' is not subsettable

如果您在 R 中创建具有各种不同成员的复杂新类,则需要定义[运算符的含义,并且需要实现它。SpatialPoints按一个类对一个类进行子集化是什么意思SpatialPolygon?R 自己无法知道这一点,因此当sp包的作者创建SpatialPolygons类时,他必须编写基于传递给 operator 的操作数进行子集化的方法[您可以在此处查看源代码。

如果你追溯逻辑,你会看到在 的情况下spdf[poly1,],子集是由其他空间函数的使用决定的,归结为

which(!is.na(over(spdf, geometry(poly1))))
#> 39 40 41 50 51 52 61 62 63 
#> 39 40 41 50 51 52 61 62 63

然后使用这些数字子集对实际多边形进行子集化,以返回仅由子集组成的新对象。这意味着我们可以points_outside以类似的方式获得:

points_within  <- spdf[poly1,] 
points_outside <- spdf[which(is.na(over(spdf, geometry(poly1))))]

plot(spdf)
plot(poly1, add = TRUE)
plot(points_within, col="blue", pch = 16, add = TRUE)
plot(points_outside, col="red", pch = 16, add = TRUE)

在此处输入图像描述

但是要回答您的主要问题,即为什么不起作用spdf[-poly1,],您必须意识到这实际上意味着'['(spdf, -poly1). 要对此进行评估,首先需要进行评估-poly1,但如果您尝试这样做,那么您会得到:

-poly1
#> Error in -poly1 : invalid argument to unary operator

当然,将-运算符单独应用于SpatialPoints对象并没有真正意义。拿分从何而来

实际上,可以编写函数使其以这种方式工作,但需要进行一些复杂的非标准评估。您可以在该 GitHub 页面上将其作为功能请求提交,但我个人很乐意使用上述功能。

我希望这能让事情变得更清楚。


推荐阅读