首页 > 解决方案 > tidy文本挖掘时widyr和ggraph中的相关性和图形布局

问题描述

我正在使用教程(https://www.tidytextmining.com/nasa.html?q=correlation%20ne#networks-of-keywords)来了解整洁的文本挖掘。我希望有人可以帮助解决两个问题:

  1. 在本教程中,用于制作图表的相关性为 0.15。这是最佳实践吗?我找不到任何文献来帮助选择中断。
  2. 在教程所附的图表中,如何选择集群中心性?更重要的词更靠近中心吗?

非常感谢在此处输入图像描述

标签: nlptidytextggraph

解决方案


  • 我不知道有任何关于用于这种网络分析的相关阈值的文献;这将(我相信)取决于您的特定数据集以及在您的上下文中如何使用语言。这是一个启发式的决定。考虑到相关系数的测量值,我预计 0.15 会低于您可能使用的值。

  • layout该图通过ggraph的参数在二维图中直观地表示。您可以在此处阅读更多相关信息,但非常重要的一点是有很多选项,它们对您的图表的外观有很大影响,而且通常不清楚什么是最佳选择。


推荐阅读