首页 > 解决方案 > 创建数据透视表并查找具有多种类型的书籍之间的相关性

问题描述

我有一张桌子,就像

book_id original_title  tag_id  tag_name
1     The Hunger Games  11305   fantasy
1     The Hunger Games  26771   scifi
1     The Hunger Games  26138   romance
10000       The First World War 14467   historical
10000       The First World War 21689   nonfiction

我想创建一个数据透视表,然后根据流派找到相互关联的书籍。我已经只使用评级来完成这项工作,但这相对简单,因为每本书只有一个评级。由于每本书都有多种类型,是否有创建此数据透视表的好方法?

其最终目的是创建一个简单的推荐系统。

标签: pythonpandasmachine-learningstatisticsrecommender-systems

解决方案


也许这可以帮助:

df.pivot(index='original_title',columns='tag_name',values='tag_id')

推荐阅读