r - 如何计算文本但不包括括号中的单词?
问题描述
我想生成一个新列,显示数据框中每部电影的字数,但是有些电影的名称包括括号,我不想计算括号内的单词,我该如何编码?顺便说一句,我正在尝试使用 str.count 函数,并展示了计算所有单词的代码。
movie <- movie %>% mutate(words.of.title = str_count(str_trim(film), "\\S+"))
解决方案
这是一个选项,用于检查以空格 ( \\s
) 或字符串开头( ^
)分隔的单词(字母数字字符)的计数
library(tidyverse)
movie %>%
mutate(words.of.title=str_count(str_trim(film), "(^|\\s)[[:alnum:]]+"))
推荐阅读
- reactjs - React-leaflet 不显示加载了 leaflet.css 或调整大小的地图
- ruby-on-rails - 测试自动化 Ruby、RSpec、Capybara:日期/时间选择器错误
- python - 函数未将值传递给其他函数
- javascript - Sliderjs 和 React 所需的行为问题
- asp.net-core - 如何添加声明或角色
- reactjs - Formik 字段中的空数据值在控制台日志中引发警告
- python - 在某些列上标注编码器和 Inverse_Transform
- wordpress - Talend TRESTClient 错误(将数据从 Wordpess 发送到 MYOB 会计软件)
- neovim - Vim 拆分终端未按预期打开
- javascript - React:如何修复“超出最大更新深度错误”