r - 如何从 csv 文件中删除非字母字符和列
问题描述
我有一个如下所示的 csv 文件:
在某些部分,列中的数据是这样的:
如您所见,并且由于存在“=”符号,因此它希望将其转换为公式,但是在这种情况下我需要的是单词“rama ...
我从垃圾邮件文件中提取了这个术语,并将 R 转换为稀疏矩阵。所以我的问题是如何从 R 中的此标头中删除非字母数字字符,然后将其再次转换为 csv 文件?
谢谢
解决方案
如果您想要一个字面答案,您可以尝试使用gsub
替换任何具有一个或多个非字母数字字符的条目:
df <- data.frame(v1=c(1,2,3), v2=c("#NAME?", "two", "#NAME?"),
stringsAsFactors=FALSE)
df <- data.frame(sapply(df, function(x) gsub(".*[^A-Za-z0-9].*", "", x)))
df
v1 v2
1 1
2 2 two
3 3
演示
但这里最好/最简单的事情可能是修复您的 Excel 公式,以便您捕获这些错误,并只显示空字符串或其他一些合理的消息。据我所知,这基本上是一个 Excel 问题,而不是 R 问题。
推荐阅读
- go - 无法安装 godef
- node.js - 关系“未定义。{table_name}”不存在 - 使用 Mocha 和 Chai 对 NodeJS 无服务器应用程序进行单元测试
- substrate - 'type Version = Version' 在 Substrate 中不起作用
- java - 如何通过 Amazon API Gateway (JAVA) 检索用户的公共 IP 地址
- python - 在 Django rest Framework 中计算视图中的客户数量
- telegram - 当我尝试为电报 youtube 下载器机器人部署应用程序时显示错误 404
- laravel - 试图在 laravel-8 的 index.blade.php 的 listView 中显示为特定用户注册的某些产品
- wxwidgets - 如何在 wxGTK 中设置配置选项以生成 libwx_gtk2u_gl-3.0.so?
- javascript - 省略 JS 对象中未定义的计算属性
- java - 如何在android中制作一个顶级片断对话框?