r - 规范化 R 中的俄语字符
问题描述
我有一个这样的俄罗斯地区和城市的数据框。
>df
russian_region
1 <U+0421><U+0432><U+0435><U+0440><U+0434><U+043B><U+043E><U+0432><U+0441><U+043A><U+0430><U+044F> <U+043E><U+0431><U+043B><U+0430><U+0441><U+0442><U+044C>
2 <U+0421><U+0430><U+043C><U+0430><U+0440><U+0441><U+043A><U+0430><U+044F> <U+043E><U+0431><U+043B><U+0430><U+0441><U+0442><U+044C>
3 <U+0420><U+043E><U+0441><U+0442><U+043E><U+0432><U+0441><U+043A><U+0430><U+044F> <U+043E><U+0431><U+043B><U+0430><U+0441><U+0442><U+044C>
4 <U+0422><U+0430><U+0442><U+0430><U+0440><U+0441><U+0442><U+0430><U+043D>
5 <U+0412><U+043E><U+043B><U+0433><U+043E><U+0433><U+0440><U+0430><U+0434><U+0441><U+043A><U+0430><U+044F> <U+043E><U+0431><U+043B><U+0430><U+0441><U+0442><U+044C>
6 <U+0422><U+0430><U+0442><U+0430><U+0440><U+0441><U+0442><U+0430><U+043D>
7 <U+041D><U+0438><U+0436><U+0435><U+0433><U+043E><U+0440><U+043E><U+0434><U+0441><U+043A><U+0430><U+044F> <U+043E><U+0431><U+043B><U+0430><U+0441><U+0442><U+044C>
8 <U+041F><U+0435><U+0440><U+043C><U+0441><U+043A><U+0438><U+0439> <U+043A><U+0440><U+0430><U+0439>
9 <U+041E><U+0440><U+0435><U+043D><U+0431><U+0443><U+0440><U+0433><U+0441><U+043A><U+0430><U+044F> <U+043E><U+0431><U+043B><U+0430><U+0441><U+0442><U+044C>
10 <U+041D><U+0438><U+0436><U+0435><U+0433><U+043E><U+0440><U+043E><U+0434><U+0441><U+043A><U+0430><U+044F> <U+043E><U+0431><U+043B><U+0430><U+0441><U+0442><U+044C>
russian_city
1 <U+0415><U+043A><U+0430><U+0442><U+0435><U+0440><U+0438><U+043D><U+0431><U+0443><U+0440><U+0433>
2 <U+0421><U+0430><U+043C><U+0430><U+0440><U+0430>
3 <U+0420><U+043E><U+0441><U+0442><U+043E><U+0432>-<U+043D><U+0430>-<U+0414><U+043E><U+043D><U+0443>
4 <U+041D><U+0430><U+0431><U+0435><U+0440><U+0435><U+0436><U+043D><U+044B><U+0435> <U+0427><U+0435><U+043B><U+043D><U+044B>
5 <U+0412><U+043E><U+043B><U+0433><U+043E><U+0433><U+0440><U+0430><U+0434>
6 <U+0427><U+0438><U+0441><U+0442><U+043E><U+043F><U+043E><U+043B><U+044C>
7 <U+041D><U+0438><U+0436><U+043D><U+0438><U+0439> <U+041D><U+043E><U+0432><U+0433><U+043E><U+0440><U+043E><U+0434>
8 <U+041F><U+0435><U+0440><U+043C><U+044C>
9 <U+041E><U+0440><U+0435><U+043D><U+0431><U+0443><U+0440><U+0433>
10 <U+041D><U+0438><U+0436><U+043D><U+0438><U+0439> <U+041D><U+043E><U+0432><U+0433><U+043E><U+0440><U+043E><U+0434>
我不知道为什么我会看到上面的 UTF-8 字符,而当我看到的时候
df$russian_city
,我可以看到俄语的名字
> df$russian_region
[1] "Свердловская область" "Самарская область" "Ростовская область" "Татарстан" "Волгоградская область" "Татарстан" "Нижегородская область" "Пермский край"
[9] "Оренбургская область" "Нижегородская область"
我的环境设置是否有问题,我的 R 会话无法读取俄语字符,我该如何处理?
解决方案
我在加载数据库时也遇到了很多问题。我尝试了此笔记本中使用的方法,但效果不佳。所以我放弃了,只是将语言环境更改为俄语,现在一切正常。如果其他答案不起作用,请尝试这个。
Sys.setlocale(category = "LC_ALL", locale = "Russian")
推荐阅读
- python - 当满足某些条件时,你能打破过滤功能吗?例如,如果 x == 237 我想打破过滤器功能
- python - Apache Airflow 的 hive thrift 或 HiveMetastore 的问题
- glsl - Vulkan Uniform 中的数组问题
- kubernetes - 获取有关 AKS 中的污点控制器事件的通知
- 3d - Yaw-Roll-Pitch 变换
- sql - 如何在 SQL 中返回分多天的事件持续时间?
- pytorch - 在 Pytorch 中构建和训练自动编码器以降低向量输入的维度
- c# - 尝试安装 Emgu.CV.runtime.windows VS 2019 winforms,框架 4.8 时出现 EMGU 错误
- elasticsearch - 如何执行此弹性搜索查询
- jenkins - 在成功完成另外 5 个工作后触发构建管道工作