python - 如何总结完整的预测评级数组和实际已知评级之间的差异(python)
问题描述
基本上,我使用一堆训练评级生成了一系列完整的预测评级。与这个训练评级数据库分开,我有第二个非重叠数据库,其中包含更多训练时未知的评级,但现在存在预测。
我想将生成的预测评级与我的测试数据库中的实际评级进行比较。
例如,在我的测试数据库中可能是:
user ID, item ID, rating, timestamp
1,356,4.0,964980962
1,500,3.0,964981208
1,593,4.0,964983793
在我的预测收视率数据库中是:
1,1,rating
1,2,rating
1,3,rating
....
1,355,rating
1,356,**RATING**
1,357,rating
因此,从上面的两个文本文件中,我想比较用户 1、项目 356、用户 1 项目 500 等的真实评分和生成评分,所有用户和项目都存在于两者中。
实际上,我去年已经编写了一些代码,它为我做了这件事,但我不记得我做了什么。我记得我必须将两者都加载到内存中,然后有一种超级简洁的方法,我可以在嵌套循环结构中总结差异。
解决方案
推荐阅读
- apache-spark - 在 Spark 中使用 Kinesis 生产者库
- html - 在 HTML5 中注入自定义元素,然后使用 XPath 检索其值返回空白
- html - 放大 (ctrl+, ctrl-) 时,我的导航栏无法使用?
- django - 如何在 django-tables2 中修复“需要 tableXXX 的参数数据”?
- python - 在python中编写模式“a”
- typescript - 具有默认和类型推断的 TypeScript 可区分联合类型
- python - 在excel文件中使用熊猫查找均值
- c# - 如何将文本框中的文本(包含标签和坐标)转换为指定坐标处的按钮?
- javascript - 有没有办法在覆盖的元素上选择性地使用鼠标事件?
- ms-access - 使用 Like "*" 作为 True 条件的 IIF 查询表达式