nlp - PolyAnalyst:分类法的关键字选项卡是如何计算的?
问题描述
分类中有一个关键字选项卡,显示由 PDL 表达式创建和定义的特定类别的关键字。如果我创建同一类别的子集并在其上运行关键字提取节点,那么我永远不会看到与分类法的关键字列表相同的结果。这是为什么?如果方法看起来相同并且它们似乎都使用相同的统计字典,它们有何不同?
解决方案
分类节点中关键字选项卡的计算是针对特定类别中相对于整个数据集的词进行的,而分类子集节点之后的关键字提取节点中的计算仅针对这些相同的词相对于相应的子集进行,因此存在差异。
换句话说,通过从分类节点中删除子集,您正在删除一些为关键字计算提供信息的上下文。
推荐阅读
- typo3 - TYPO3:我可以删除typo3_src-version 文件夹吗
- donations - 如何接收慈善应用内捐款
- javascript - javascript新手,这适合什么样的主题?
- python-3.x - 使用 LightGBM 示例进行网格搜索
- angularjs - TypeError: XXX undefined with AngularJS $inject Property annotation
- angular - 使用 mat-select 以反应形式列出依赖项
- python - 从长度小于 3 的列表句子中删除单词
- bitbucket - Bitbucket - 如何强制合并首先到开发分支然后到主分支?
- unity3d - 我可以在 Unity 中使用 powershell 命令吗?
- github - 超出 API 速率限制