r - 使用 R 中的特殊字符从 .txt 文件中读取数据帧
问题描述
我在数据框中的一列中有很多特殊字符的语音转录,如下所示:
">like I don't understand< sorry like how old's your mom¿"
"°ye[a:h]°"
"°I don't know°"
当我使用 读入数据框read.table
时,我得到以下输出,其中错误地插入了几个有趣的新字符:
R中的输出:
">like I don't understand< sorry like how old's your mom¿"
"°ye[a:h]°"
"°I don't know°"
我该如何解决这个问题?
解决方案
您可以在导入时指定编码,也可以在导入数据后指定编码。
选项1
df <- read.table('path/file.ext', econding = "UTF-8", ...)
选项 2
x <- c(
">like I don't understand< sorry like how old's your mom¿",
"°ye[a:h]°",
"°I don't know°")
Encoding(x) <- 'UTF-8'
print(x)
推荐阅读
- asp.net - 在 ASPX 中不使用声明性 SqlDataSource 时如何命名事件处理程序?
- xcode - SceneKit:导入的 dae 文件未复制到应用程序包
- docker - com.docker.network.bridge.host_binding_ipv4 如何为多个网络工作?
- c - 如何强制 cpu 核心刷新 c 中的存储缓冲区?
- sql - 如何从 SYSDATE 获取前几天、几个月、季节
- git - cPanel Cron Job 运行 git reset
- java - Java 线程由于不明原因创建了额外的线程
- ruby-on-rails - Rails options_from_collection_for_select 显示除当前用户之外的所有用户
- r - 将 ggplot2::geom_line 图例形状更改为类似于 ggplot2::geom_point 的图例形状的“点”
- node.js - ExpressJS 不同的域名 - CORS