r - 在 str_extract() 之后将字符向量转换为 data.frame
问题描述
我有一个数据框:
head(objeto)
Edital
1 GOVERNO DO ESTADO DE MINAS GERAIS
2 SECRETARIA-GERAL DA GOVERNADORIA DO ESTADO DE MINAS GERAIS
3 EDITAL DA CONCORRÊNCIA Nº 001/2012
4 EDITAL DE LICITAÇÃO
5 CONCORRÊNCIA Nº. 001/2012
6 TIPO: TÉCNICA E PREÇO
我想在其中找到正则表达式“Objeto”,所以:
regex.objeto <- "(?<=Objeto: )([^.]+)"
objeto <- str_extract(edital, regex.objeto)
objeto
[1] "CONTRATAÇÃO DE EMPRESA PARA A PRESTAÇÃO DE SERVIÇOS\", \"ESPECIALIZADOS DE AFERIÇÃO DO DESEMPENHO E DA QUALIDADE DA\", \"CONCESSIONÁRIA MINAS ARENA GESTÃO DE INSTALAÇÕES ESPORTIVAS\", \n\"S"
结果是一个字符向量,但我想要一个没有这些符号的数据框\", \
我在想结果是这样的:
"CONTRATAÇÃO DE EMPRESA PARA A PRESTAÇÃO DE SERVIÇOS ESPECIALIZADOS DE AFERIÇÃO DO DESEMPENHO E DA QUALIDADE DA"
谢谢你们!
解决方案
也许您可以使用gsub
从字符串中删除双引号和"\n"
.
objeto <- gsub('"|\n|,', '', objeto)
返回:
objeto
#[1] "CONTRATAÇÃO DE EMPRESA PARA A PRESTAÇÃO DE SERVIÇOS ESPECIALIZADOS DE AFERIÇÃO DO DESEMPENHO E DA QUALIDADE DA CONCESSIONÁRIA MINAS ARENA GESTÃO DE INSTALAÇÕES ESPORTIVAS S"
这也可以写成:
objeto <- gsub('["\n,]', '', objeto)
或str_remove_all
从stringr
图书馆使用
stringr::str_remove_all(objeto, '[\n",]')
这是一个快捷方式str_replace_all
stringr::str_replace_all(objeto, '[\n",]', '')
推荐阅读
- python - 为 Iris 数据集构建 ANN 的问题
- apache - 在 localhost 上同时运行 express 和 apache
- django - 如何在 django 中对多个字段使用计数?
- node.js - mssql Node.JS 返回超出预期的结果并使 REST 调用难以解析
- python - tkinter:无法从我的 USB 连接的 android 手机中选择目录
- c - c fopen() 在打开许多文件时给我分段错误
- javascript - 函数有条件地运行异步代码,但需要在其他时间运行同步。如何保持干燥?
- ruby - Jekyll 中不显示静态文件
- c++ - 如何从歌曲的专辑字段中删除标记“[None]”并用空格替换 None?
- linux - RaspberryPI NextCloudPi Docker - 加载页面问题