首页 > 解决方案 > 我可以使用字符变量创建相关图吗?

问题描述

我的数据集是餐厅 Yelp 评论,我想看看是否有一种方法可以使用 corrplot 包创建单词和星级评分之间的相关图。

我在下面创建了 Z,其中包含星级、字数 (n) 和字数。我不知道从哪里开始,因为我知道我不能在相关图中直接使用变量这个词,因为它是一个字符而不是一个因素。如果我只是在 n 和 stars 之间进行关联,实际上并没有给我任何有用的信息。关于我如何能够提出单词和星星之间的相关性的任何想法?

Z <- ws %>% select(n, stars, word)
Z

# A tibble: 39,322 x 3
# Groups:   stars [5]
       n stars word     
   <int> <int> <chr>    
 1  7841     5 food     
 2  6046     4 food     
 3  4027     5 service  
 4  3741     3 food     
 5  3133     1 food     
 6  3046     4 service  
 7  2837     5 delicious
 8  2832     2 food     
 9  2803     5 love     
10  2785     5 time     
# … with 39,312 more rows

标签: rcorrelationtext-miningr-corrplot

解决方案


推荐阅读