r - 如何在 dplyr 中汇总变量
问题描述
我的问题是如何在函数中输入列号vars()
。如果我输入列位置,它不起作用。但是,如果我输入列名,它就可以工作。具体使用此代码:
productos_por_profundidad <- productos_por_profundidad%>%
group_by(CODIGO_CLIENTE)%>%
summarise_at(vars(3:ncol(productos_por_profundidad)),function(x) sum((x)))
它适用于名称,但在很长一段时间内效率不高。
数据样本
productos_por_profundidad <- structure(list(CODIGO_CLIENTE = c(12554L, 125713L, 125724L, 126095L,
12618L, 12618L), SIGNIFICADO_ESTADO = structure(c(3L, 3L, 3L,
3L, 3L, 3L), .Label = c("Abandonada CE", "Activa CE", "ACTIVO CD",
"ACTIVO LEA/FAC", "ANULADO CD", "ANULADO PR", "APROBADO PR",
"Bloqueada parcialmente CE", "Bloqueada totalmente CE", "CAMBIO DE TIPO TC/MC",
"Cancelada CE", "CANCELADA TC/MC", "CANCELADO PR", "CASTIGADO PR",
"COBRO JUDICIAL PR", "DESEMBOLSADO PR", "Embargada CE", "Inactiva CE",
"LEGAL TC/MC", "MORA TC/MC", "NORMAL TC/MC", "OTROS PR", "PAGADO CD",
"Pendiente de aprobar CE", "PERDIDA O ROBADA TC/MC", "RECHAZADO PR",
"REESTRUCTURADO PR", "REGISTRADO PR", "RETENIDO CD", "SIN USO (3 O MAS MESES) TC/MC",
"TARJETA NUEVA TC/MC", "TARJETAS VENCIDAS TC/MC", "Transferida al BC CE"
), class = "factor"), `Certificado en Dolares (US$)` = c(0, 0,
0, 0, 0, 1), `Certificado en Pesos (RD$)` = c(1, 1, 1, 1, 1,
0), `Cuentas Corrientes en Pesos (RD$)` = c(0, 0, 0, 0, 0, 0),
`Cuentas de Ahorro en Dólares (USD$)` = c(0, 0, 0, 0, 0,
0), `Cuentas de Ahorro en Euros (EUR$)` = c(0, 0, 0, 0, 0,
0), `Cuentas de Ahorro en Pesos (RD$)` = c(0, 0, 0, 0, 0,
0), Factoring = c(0, 0, 0, 0, 0, 0), Leasing = c(0, 0, 0,
0, 0, 0), `Linea de Credito` = c(0, 0, 0, 0, 0, 0), Multicredito = c(0,
0, 0, 0, 0, 0), `Nómina Electrónica` = c(0, 0, 0, 0, 0, 0
), `Prestamo Comercial` = c(0, 0, 0, 0, 0, 0), `Prestamo de Vehiculo` = c(0,
0, 0, 0, 0, 0), `Prestamo en Tienda` = c(0, 0, 0, 0, 0, 0
), `Prestamo Hipotecario` = c(0, 0, 0, 0, 0, 0), `Prestamo Personal` = c(0,
0, 0, 0, 0, 0), `Tarjeta de Credito` = c(0, 0, 0, 0, 0, 0
)), row.names = c(NA, 6L), class = "data.frame")
解决方案
您应该使用colnames
这样定义列:
library(dplyr)
df%>%
group_by(CODIGO_CLIENTE)%>%
summarise_at(vars(colnames(df)[3:ncol(df)]),function(x) sum((x)))
PS:df
在我的示例中,我将您的数据集的名称替换为
推荐阅读
- python - 在 Heroku 上部署我的不和谐机器人时出错。我怎样才能改变这个?
- python - 根据值的长度对字典进行排序
- haskell - 如何处理这种数据类型
- html - 使用 htaccess 从 /subfolder/index.html 重定向到 /subfolder/
- android-studio - 每个活动中的 Google 横幅广告
- vue.js - 当我尝试通过道具从子组件更新主组件数据时,我收到此错误
- php - 未捕获的 PDOException: SQLSTATE[HY093]:Invalid parameter number: 绑定变量的数量与标记的数量不匹配
- spring - 使用键作为字段名称的索引 HashMap。休眠搜索
- r - 从前两行凌乱的 Excel 数据中的字符在 R 中创建描述性变量名称
- apache - Apache ProxyPass 优化与通过重写规则进行代理