r - 仅保留 RSQLite 列中的第一个单词
问题描述
我正在将 SQL 代码转移到 R 中。
我有一个数据集,想从新列的列中提取第一个单词。
数据集
df
Col_A ColB
ABC JEn JDn 9
nemmdn mend 10
pwek ne me ne 12
预期输出:
Col_A ColB Col_A_Abbreviation
ABC JEn JDn 9 ABC
nemmdn mend 10 nemmdn
pwek ne me ne 12 pwek
以下是我目前拥有的:
library(DBI)
library(RSQLite)
mydb <- dbConnect(RSQLite::SQLite(), "")
dbWriteTable(mydb, "df_1", df)
dbGetQuery(mydb,
'SELECT IF(INSTRB(Col_A, \' \', 1, 1) >0,
SUBSTR(Col_A, 1, INSTRB(Col_A, \' \', 1, 1) - 1),
Col_A) AS Col_A_Abbreviation FROM df_1')
这是我的错误信息:
Error in result_create(conn@ptr, statement) : no such function: IF
RSQLite 对它可以使用的功能有限制吗?
解决方案
1) sqldf/RSQLite如果您使用的是 SQLite 后端,那么您只能使用 RSQLite 支持的功能。试试这个在df
最后的注释中可重复定义的地方。
library(sqldf)
sqldf("select
*,
substr([Col_A], 1, instr([Col_A], ' ') - 1) FirstWord
from df")
给予:
Col_A ColB FirstWord
1 ABC JEn JDn 9 ABC
2 nemmdn mend 10 nemmdn
3 pwek ne me ne 12 pwek
1a)如果条目只能包含一个单词,则在末尾附加一个空格以确保始终至少有一个空格可以匹配。
sqldf("select
*,
substr([Col_A], 1, instr([Col_A] || ' ', ' ')-1) FirstWord
from df")
2) 基础 R
在基础 R 中,删除第一个空格及其后的所有内容:
transform(df, FirstWord = sub(" .*", "", Col_A))
笔记
df <-
structure(list(`Col_A` = c("ABC JEn JDn", "nemmdn mend", "pwek ne me ne"
), `ColB` = c(9L, 10L, 12L)), class = "data.frame", row.names = c(NA,
-3L))
推荐阅读
- blazor - 错误 CS1660:无法将 lambda 表达式转换为类型“bool”,因为它不是委托类型
- python - 使用 mypy 扫描包会在不同的机器上产生不同的结果
- wordpress - Woo-commerce:移动设备上的 2 列产品间距不正确
- python - 是否可以在 cassandra 中使用 uuid 创建表?
- powershell - powershell 如果检查多个文件的条件可用
- intellij-idea - 不能用ideaVim逐行粘贴我复制的内容
- javascript - 使用 Sequelize 多次加入同一个表
- mongodb - 是否可以在使用副本集部署后将 Sharding 应用于 Mongo DB?
- php - PHP 根据日期将活动排序到正确的数组中
- ansible - Ansible 突然使用 svr4pkg 作为 yum 的后端