首页 > 解决方案 > 如何总结完整的预测评级数组和实际已知评级之间的差异(python)

问题描述

基本上,我使用一堆训练评级生成了一系列完整的预测评级。与这个训练评级数据库分开,我有第二个非重叠数据库,其中包含更多训练时未知的评级,但现在存在预测。

我想将生成的预测评级与我的测试数据库中的实际评级进行比较。

例如,在我的测试数据库中可能是:

user ID, item ID, rating, timestamp
1,356,4.0,964980962 
1,500,3.0,964981208
1,593,4.0,964983793

在我的预测收视率数据库中是:

1,1,rating
1,2,rating
1,3,rating
....
1,355,rating
1,356,**RATING**
1,357,rating

因此,从上面的两个文本文件中,我想比较用户 1、项目 356、用户 1 项目 500 等的真实评分和生成评分,所有用户和项目都存在于两者中。

实际上,我去年已经编写了一些代码,它为我做了这件事,但我不记得我做了什么。我记得我必须将两者都加载到内存中,然后有一种超级简洁的方法,我可以在嵌套循环结构中总结差异。

标签: pythonarraysnumpydifference

解决方案


推荐阅读