powerbi - 词云 - 获得前 N 个词频
问题描述
我有一个包含多列的表。其中一列是“采取的行动”。该列的每一行都是一个句子。我的任务是确定在采取的行动列中哪些最常用的词被使用的词数最多。
我正在使用文字云来可视化这一点。词云为我提供了一个额外的功能,可以使用对我的任务至关重要的停用词。词云也让我可以灵活地根据切片器进行过滤,这对于我的目的来说也是非常必要的。
问题是我只想可视化词云中频率最高的 N(比如说,50)的词。我找不到任何选项来执行此操作。
谁能帮我过滤掉列中出现频率最高的 50 个单词?唯一的限制是我应该能够应用切片器和停用词(或任何等效的停用词)。
我曾尝试将该列复制为 PowerQuery 中的单独查询并将其设为单词列表,但这无济于事,因为我无法使用基于新词云上其他列的切片器。
解决方案
你可以总结你的表格,这样你就可以计算出每个“采取的行动”,并以此为基础创建词云
Actions Taken = SUMMARIZE(TableName,TableName[action taken],"count",COUNT(TableName[action taken])
- 类别是 [已采取的行动]
- 值为 [count]
- 在 Visual Level Filters 中,为 [采取的措施] 选择 Top N 过滤器
- "Show Items:" 是 Top 和 50
- 按值是 [count]
推荐阅读
- android - 华为开发者控制台:如何将应用从一个开发者账户转移到另一个开发者账户?
- r - 如何在我的 R 脚本中指定 pandoc 路径?
- r - 如何使用交叉验证来确定使用训练、验证和测试集的最终模型
- python - 我无法连接到 mqtt 中的代理,我想知道为什么?
- wordpress - HTML 表单发布到远程目标 - Google Analytics 推荐
- laravel - 提交搜索字段时加载 laravel 数据表
- javascript - 为什么下面的函数执行 `greet({ name = 'Rauno' } = {})` 而不是 `greet(name = 'Rauno')`?
- kubernetes - ClusterIP with externalIPs - 无法从集群外部访问
- gitlab - GitLab CI:如何继续做失败的工作
- bash - 如何根据字符串拆分文本?