首页 > 解决方案 > 如何从 csv 文件创建一个数据框,其文本由管道 I 分隔?

问题描述

我有一个包含患者数据的 csv 文件,但所有数据都写在一个名为id_paciente|dt_coleta|de_origem|de_exame|de_analito|de_resultado|cd_unidade|de_valor_referencia的单列中,以字符串 | 分隔的文本,如图所示

带有患者的 csv 文件

我想将其转换为标题为“id_patient”、“dt_exame”等的多个列,以便我可以正确处理它。

所以它基本上写成

id_paciente
202018|13/06/2020|HOSP|PCR em tempo real para detecção de Coron|Resultado COVID-19:|Não detectado|NULL|Não detectado            
202025|11/05/2020|HOSP|Sorologia SARS-CoV-2/COVID19 IgG/IgM|IgG                                                                 
202025|11/05/2020|HOSP|Sorologia SARS-CoV-2/COVID19 IgG/IgM|COVID IgG Interp|Não reagente|NULL|                                 
202025|11/05/2020|HOSP|PCR em tempo real para detecção de Coron|Resultado COVID-19:|Não detectado|NULL|Não detectado            
202025|11/05/2020|HOSP|Sorologia SARS-CoV-2/COVID19 IgG/IgM|IgM                                                                 
202025|11/05/2020|HOSP|Sorologia SARS-CoV-2/COVID19 IgG/IgM|COVID IgM Interp|Não reagente|NULL|

我尝试过使用 tidyr::separate,但我无法通过这样做来解决它

df %>% separate(id_paciente.dt_coleta.de_origem.de_exame.de_analito.de_resultado.cd_unidade.de_valor_referencia, c("id_paciente", "dt_coleta", "de_origem", "de_exame", "de_analito", "de_resultado", "cd_unidade", "de_valor_referencia"))

任何帮助将不胜感激。

标签: r

解决方案


推荐阅读