python - 查找数百万条记录的 Pearson 相关性
问题描述
我正在做一个 NLP 任务,其中我有一个按天分组的文本中出现的单词分布。我想找到给定单词与数据库中所有其他单词之间的 Pearson 相关性。是否可能有一些算法解决方案,而不仅仅是手动迭代数据库中的所有其他单词并计算相关性。可能与图表有关?
解决方案
您可以使用 numpy 或 pandas(矢量化版本而不是遍历所有记录)。
推荐阅读
- javascript - 如何使用 java 脚本删除 django 动态表单集 - 索引问题?
- angular - 自定义指令更改输入中的数字格式并在 Angular 8 中使用计算中的数字
- flutter - 颤振从json中获取数据“字符串不是Iterable的子类型
" - mysql - SQL 根据第一个值两次从同一个表中获取不同的值
- javascript - 如何在 JavaScript 中对对象的所有值求平方?
- windows - Windows - 使用 CreateProcessWithTokenW 在会话 0 中创建一个进程
- javascript - 如何解决 Edge 和 Chrome 上的这些 html2canvas 滚动错误?
- algorithm - 在几个玩家之间获得所有可能的卡片排列
- excel - 如何使用powershell更改excel中现有OLEDB连接的属性?
- github-actions - 如何为 dart 和 python 设置 github 操作