首页 > 解决方案 > 希腊字母表在数据框中转换为 unicode?任何支持使用不同字母的软件包?

问题描述

我创建了一个包含希腊单词的列,例如:

vocab<-c("να", "το","δεν", "είναι") 但是,当显示在数据框中时,这些词显示为:

“㯚, to, deν, eί㯚ι” 分别。

是否有任何软件包可以帮助 R 应对外国字母的使用,并像对待标准英语一样对待它们?我真的不明白为什么他们不会自动将这些符号视为普通的英文字母。

谢谢你的帮助!

标签: rnlp

解决方案


以下对我有用。

Sys.setlocale(category = "LC_ALL", locale = "en_US.UTF-8")

vocab<-c("να", "το","δεν", "είναι")
Encoding(vocab) = "UTF-8"
cat(vocab, "\n")
να το δεν είναι

推荐阅读