nlp - tidy文本挖掘时widyr和ggraph中的相关性和图形布局
问题描述
我正在使用教程(https://www.tidytextmining.com/nasa.html?q=correlation%20ne#networks-of-keywords)来了解整洁的文本挖掘。我希望有人可以帮助解决两个问题:
- 在本教程中,用于制作图表的相关性为 0.15。这是最佳实践吗?我找不到任何文献来帮助选择中断。
- 在教程所附的图表中,如何选择集群中心性?更重要的词更靠近中心吗?
解决方案
我不知道有任何关于用于这种网络分析的相关阈值的文献;这将(我相信)取决于您的特定数据集以及在您的上下文中如何使用语言。这是一个启发式的决定。考虑到相关系数的测量值,我预计 0.15 会低于您可能使用的值。
layout
该图通过ggraph的参数在二维图中直观地表示。您可以在此处阅读更多相关信息,但非常重要的一点是有很多选项,它们对您的图表的外观有很大影响,而且通常不清楚什么是最佳选择。
推荐阅读
- javascript - 如何获取超级父div宽度并根据超级父div宽度设置子div和父div宽度
- c# - postgresql 附近出现错误 42601 语法
- mysql - IF 条件在存储过程中不起作用
- shell - 如何将环境变量作为 Dockerfile 中 shell 脚本的参数传递?
- javascript - 我如何让机器人忽略某些角色// Discord.js
- android - android清单错误@xml/文件路径
- spring - 使用 JAVA 进行 Elasticsearch UpdateByQueryRequestBuilder 单元测试
- java - Android:自定义键盘可以记录用户输入的文本吗?
- docker - SSH 配置文件端口转发在 Docker 中未按预期工作(撰写)
- oracle - 为什么 oracle '使用 NCHAR_CS' 不能处理扩展的 ASCII 字符