首页 > 解决方案 > 将汉字从 Excel 导出到 R

问题描述

我在 Excel 中有一个文件,其中有一列包含简体中文字符。当我从相应的 CSV 文件在 R 中打开它时,我只会得到?

恐怕问题出在从 Excel 导出到 CSV 时,因为当我在文本编辑器上打开 CSV 文件时,我也会得到?

我怎样才能解决这个问题?

标签: rcsvcharacter-encoding

解决方案


保护您的中文/Unicode 字符的最佳方法是从以下位置读取文件.xlsx

library(readxl)
read_xlsx("yourfilepath.xlsx", col_types = "text")

如果您的文件太大而无法读取.xlsx,那么最好的方法是打开 Excel 并手动拆分为多个文件。(我使用 8GB RAM 笔记本电脑的经验是将文件拆分为 250,000 行 x 106 列。)

如果您需要读取.csv,您的所有 Windows 设置/本地化需要与您的文件相同,但即使这样也不能保证所有 Unicode 字符(例如表情符号)的完整性。

(如果您还需要.csv其他东西,那么您可以在从 中读取数据后使用该功能R。)write.csv.xlsxR


推荐阅读