python - 评估基于内容的推荐系统(没有“用户”)
问题描述
我正在使用 FIFA 2020 数据集为足球运动员构建基于内容的 RecSys。在这种情况下,球员是“项目”,他们的得分(头球能力、运球技巧、位置得分等)是“评分”。我已经创建了余弦相似度矩阵来对每个玩家的相似度得分进行排名。我的模型只是为了做到这一点:对于任何给定的玩家,我的模型将显示前 5 个最相似的其他玩家。
我现在正处于评估模型的阶段,并且面临一些问题。在网上做了一些阅读后,我收集到我可能无法使用 RMSE 或 MAE 等统计测量。更合适的一种是 Precision and Recall(或更具体地说,Mean Average Precision MAP)。
问题是,所有这些评估指标都需要实际用户来验证(例如,实际上选择克里斯蒂亚诺·罗纳尔多作为与莱昂内尔·梅西相似的“正确”球员)。回到原始数据集,它不像电影评分/亚马逊商品的情况,其中商品实际上是由不同用户评分的——FIFA 2020 只是每个玩家的分数和属性的集合。因此,我无法“预测”另一个用户对另一个玩家的评分并以此为基础进行推荐。
因此,我想问一下是否有其他建议来评估我的模型,就推荐的类似玩家的“正确”程度而言?再一次,我的模型只是旨在显示任何给定玩家的前 5 个最相似的玩家。
解决方案
推荐阅读
- angularjs - AngularJS,购物车和产品列表之间数据流的最佳实践
- python - 有没有办法 OR 几个 re.compile() 输出?
- soap - 仅使用 wsdl 即可在没有 WebService 的情况下创建 SOAP 消息
- c# - LINQ 让重复数据
- python - 使用scrapy进行网络爬虫时进行调试?
- gcc - 尝试缓冲区溢出时堆栈上出现意外值
- javascript - 表单将在第一次提交时更新数据库,但在页面刷新之前不会再次更新
- xml - 从 xml 中提取(模式)标签
- java - 如何打印用户占用空格的字符串?
- ios - CurrentValueSubject 和 @Published 之间的区别