首页 > 解决方案 > 这个警告消息“recycled with remaining”在 R 中是什么意思?

问题描述

警告消息:在 as.data.table.list(x, keep.rownames = keep.rownames, check.names = check.names, 中:项目 2 有 1650197 行,但最长的项目有 1667524;剩余部分被回收。

标签: rdplyrdata.table

解决方案


当为 R 提供某种形式的列表输入以产生某种形式的列表输出但输入的长度和输出长度不匹配时,会出现此警告。在这些情况下,R 会根据需要重复和重用较短的列表。

请参阅此处的文档:“如果提供了列表,则每个元素都将转换为 data.table 中的一列,并自动回收较短的元素。”

但是,如果较长的列表不是较短列表长度的倍数,那么长度列表的差异不太可能是故意的,因此会出现此警告。

一些例子:

> library(data.table)
> example1 = list(x = c(1,2,3,4,5,6), y = 3)
> as.data.table(example1)
   x y
1: 1 3
2: 2 3
3: 3 3
4: 4 3
5: 5 3
6: 6 3

> example2 = list(x = c(1,2,3,4,5,6), y = c('a','b'))
> as.data.table(example2)
   x y
1: 1 a
2: 2 b
3: 3 a
4: 4 b
5: 5 a
6: 6 b

在这两个示例中,xy列表的长度不同,因此y列表已重复。这不会产生警告,因为y长度 1 或 2x是长度 6 的倍数。

> example3 = list(x = c(1,2,3,4,5,6), y = c('a','b','c','d'))
> as.data.table(example3)
   x y
1: 1 a
2: 2 b
3: 3 c
4: 4 d
5: 5 a
6: 6 b
Warning message:
In as.data.table.list(example3) :
  Item 2 has 4 rows but longest item has 6; recycled with remainder.

但是这个例子x的长度是6,y长度是4。所以在创建数据表的时候只有前两项y被重复了。R 给出警告,因为并非每个术语y都被重复使用了相同的次数。

在您的示例中,长度不是 6 和 4,而是长度为 1650197 和 1667524 的列。由于您不太可能(但可能)想要重复较短列的前 17327 个条目(1667524 - 1650197),因此 R 为您提供警告提示您检查输入列。


推荐阅读