python - Python cosine_similarity 不适用于具有 NaN 的矩阵
问题描述
需要找到像这个R func一样工作的python函数:
proxy::simil(method = "cosine", by_rows = FALSE)
即通过成对计算数据帧行之间的余弦距离来找到相似度矩阵。如果存在 NaN,它应该删除这 2 行中带有 NaN 的确切列
更新。我还尝试使用来自 scipy.spatial.distance的余弦函数在循环中的每一对行中删除NaN 。它给出了与 R 中相同的结果,但适用于年龄:(
解决方案
您可以尝试这种方法: https://github.com/Midnighter/nadist,或者您可以使用这里的 metaperture https://github.com/scipy/scipy/issues/3870_chk_weights
所描述的with ,希望对您有所帮助。nan_screen=True
我发现 Midnighter 之前在 stackoverflow 上发布过同样的问题:Compute the pairwise distance in scipy with missing values。那里还有一些其他的解决方案,但是,当他继续进行 cytonize 时,我敢打赌它们不是最好的。
推荐阅读
- javascript - 如何让 D3 教程条形图工作?
- ruby-on-rails - RSpec 如何加载带有条件验证的模型?
- javascript - 下拉菜单在 html 页面中显示不正确
- python - 尝试使用 Python 将数据插入 MySQL 表时出现编程错误
- angular - 如何以编程方式折叠分组的 Kendo Grid-angular 8?
- ios - Xcode Testflight Validate ERROR ITMS-90778 NDEF 不被允许
- ios - 如何在 Apple B2B App Store 中与已知的用户子集一起试用 iOS 应用程序
- android - 如何在此处测试 Map Android SDK Navigation
- sql - SQL 查询 - 基于多列组合行
- selenium - Scrapy/Selenium:在脚本停止之前发送超过 3 个失败的请求