r - 数据框中行中的类似字符串值
问题描述
我在 R 的数据框中有几行,其中疾病的名称相同,但措辞略有变化(加号更改为 a >
)。
有没有办法快速扫描和合并这些行?
几个例子:
Row 59: 872 - SEPTICEMIA OR SEVERE SEPSIS W/O MV ***96+*** HOURS W/O MCC
Row 60: 872 - SEPTICEMIA OR SEVERE SEPSIS W/O MV ***>96*** HOURS W/O MCC
Row 3: 003 - ECMO OR TRACH W MV ***96+*** HRS OR PDX EXC FACE, MOUTH & NECK W MAJ
Row 4: 003 - ECMO OR TRACH W MV ***>96 HRS*** OR PDX EXC FACE, MOUTH & NECK W MAJ
解决方案
uniqdrg <- unique(drgs, incomparables = FALSE )
uniqdrg$drg <- substr(uniqdrg$drg, 0, 3)
uniqdrg <- uniqdrg %>% arrange(drg)
uniqdrg<-uniqdrg[uniqdrg$drg %in% uniqdrg$drg[duplicated(uniqdrg$drg)],]
我使用此代码查找重复值。
推荐阅读
- python - Python双引号语法问题
- javascript - 在 then 函数中调用 Jquery ajax
- python - 为什么我们需要检查 value 是否等于 None?
- r - 导入包含数据框列表的 txt 文件
- android-studio - 一个动画可绘制对象的两个不同按钮
- python - 在 Python 中为 Dataflow 管道使用 WriteToBigquery 时出错。Unicode 对象没有属性“项目”
- c++ - windows下使用MSYS2编译GTK应用
- python - 使用fillna替换缺失数据
- java - IntelliJ 不编译 Java 代码,没有错误消息
- vuejs2 - 无法通过事件发射将正确的数据分配给模型