r - 在 R txt 文件中查找和替换数字
问题描述
我试图在r中的文本文件中找到所有包含任何格式数字的句子,并将其替换为它们周围的主题标签。
例如,输入以下内容:
ex <- c("I have $5.78 in my account","Hello my name is blank","do you want 1,785 puppies?",
"I love stack overflow!","My favorite numbers are 3, 14,568, and 78")
作为函数的输出,我正在寻找:
> "I have #$5.78# in my account"
> "do you want #1,785# puppies?"
> "My favorite numbers are #3#, #14,568#, and #78#"
解决方案
周围的数字是直截了当的,假设任何带有数字、句点、逗号和美元符号的东西都包括在内。
gsub("\\b([-$0-9.,]+)\\b", "#\\1#", ex)
# [1] "I have $#5.78# in my account"
# [2] "Hello my name is blank"
# [3] "do you want #1,785# puppies?"
# [4] "I love stack overflow!"
# [5] "My favorite numbers are #3#, #14,568#, and #78#"
要过滤掉编号的条目:
grep("\\d", gsub("\\b([-$0-9.,]+)\\b", "#\\1#", ex), value = TRUE)
# [1] "I have $#5.78# in my account"
# [2] "do you want #1,785# puppies?"
# [3] "My favorite numbers are #3#, #14,568#, and #78#"
推荐阅读
- microsoft-graph-api - RE:Graph API 中 $search 的 275 条记录限制
- python - numpy 只有 size-1 的数组可以转换为 Python 标量
- javascript - 如何强制 youtube 链接在浏览器中而不是在应用程序中打开?
- spring - 使用 Spring WebClient 时如何捕获 IOException?
- c++ - 即使有标题,在另一个类中也无法识别类
- python-3.x - 关于使用 OOP python 的卡片组的问题
- mongodb - MongoDB反向键值
- php - PHP 从请求的 URL 获取响应
- java - 无法使用ChainedKafkaTransaction 同步 Kafka 和 MQ 事务
- python - 定义数据框列的函数