r - 将汉字从 Excel 导出到 R
问题描述
我在 Excel 中有一个文件,其中有一列包含简体中文字符。当我从相应的 CSV 文件在 R 中打开它时,我只会得到?
恐怕问题出在从 Excel 导出到 CSV 时,因为当我在文本编辑器上打开 CSV 文件时,我也会得到?
我怎样才能解决这个问题?
解决方案
保护您的中文/Unicode 字符的最佳方法是从以下位置读取文件.xlsx
:
library(readxl)
read_xlsx("yourfilepath.xlsx", col_types = "text")
如果您的文件太大而无法读取.xlsx
,那么最好的方法是打开 Excel 并手动拆分为多个文件。(我使用 8GB RAM 笔记本电脑的经验是将文件拆分为 250,000 行 x 106 列。)
如果您需要读取.csv
,您的所有 Windows 设置/本地化需要与您的文件相同,但即使这样也不能保证所有 Unicode 字符(例如表情符号)的完整性。
(如果您还需要.csv
其他东西,那么您可以在从 中读取数据后使用该功能R
。)write.csv
.xlsx
R
推荐阅读
- c# - ASP.NET Core 3.1 InProcess 托管应用程序在启动时出现异常后未重新启动
- visual-studio - C# .NET Core 3.1 代码可以长时间使用 Visual Studio 执行,但发布的单个文件可执行文件会消耗大量内存
- javascript - 如果用户在字段中输入错误信息,则防止在字段中清除信息
- sql - 如何创建空的临时表?
- python - 在多列中为每次出现创建尽可能多的记录
- html - 带排水沟的 CSS 网格布局
- android - 不变违规:ViewPagerAndroid 已从 React Native 中删除 - IOS 上的错误
- shake-build-system - 启动服务的正确方法,如果它没有使用shake-build运行?
- html - angular adding a tag hyperlink dinamically with additional parameters
- java - Hbase - 是否可以根据 hbase 行的列数为 mapreduce 作业创建输入分割?