r - 文本清理 gsub 删除所有内容,直到找到换行符
问题描述
have <- ('Good luck!!!
___________________
Disclaimer: This email, including attachment ....
.............
Great!!!
')
have <- ('Good luck!!!
Great!!!
')
我正在处理类似电子邮件的数据集,我想在进一步分析之前对其进行清理。有一些恒定的结构,例如在Disclaimer
换行符之前和之后的部分,我认为这应该可以使用正则表达式。但免责声明的长度可能会因截断而有所不同。
我目前尝试过的如下
gsub(pattern = 'Disclaimer([\\s\\S]*)[\\n|\\r\\n|\\r]{2}', replacement = '', have)
解决方案
推荐阅读
- java - 当我使用 nextInt() 它跳过下一行
- templates - WooCommerce 订阅挂钩
- angular - 单击 Ionic 本地通知时转到特定路径
- java - 没有使用正确格式的休眠从数据库中获取数据
- jquery - Leaflet Draw - 将 GeoJSON 保存到服务器
- opengl - 如何将 pyopengl 纹理大小缩放到 pygame 窗口大小?
- python - 如何使用“on_message”事件添加命令延迟 - Discord.py
- react-native - 使用 AWS Amplify DataStore 在保存时聚合
- outlook-addin - Outlook VSTO 插件/自定义功能区:如何在 Outlook 2016 中将自定义功能区添加到家庭组(主窗口)
- python - Python中Pandas to_sql方法中的SQL查询语法错误