python - 有条件的数据表的计数元素
问题描述
我有以下熊猫表,我试图计算每部电影有多少评分优于 3。
这就是我所拥有的:
ratings
user1 user2 user3
film1 3 5 3
film2 3 4 4
film3 1 2 3
这就是我想要的:
ratings
user1 user2 user3 top_score
film1 3 5 3 1
film2 3 4 4 2
film3 1 2 3 0
我能够计算评分的数量,但我似乎无法添加条件......
谢谢
解决方案
首先将您的数据转换为 numpy 数组,然后使用 numpy 数组操作。
例如,您可以选择大于一个值的元素:
array = ... # The 2-D vector of films and ratings
high_ratings = array > 4 # Returns a boolean array
然后在 1 轴上求和(沿用户,按电影):
top_scores = high_ratings.sum(axis=1) # Returns a 1-D vector here
推荐阅读
- java - 正则表达式模式如何编写以检查 Java 中的至少一个字符串和数字?
- node.js - 使用 mongoose 更改“可用”数组的布尔值(例如,从用户输入获取的索引 4 处为 false)
- kotlin - 可点击切换连续重复导致搜索栏中的 UI 故障 - Jetpack Compose Android Studio Kotlin
- r - 用 NA 替换对称矩阵的元素对
- vue.js - 如何将 Vue2 代码转换为纯 Web 组件
- python - PYTHON:如何将我的变量调用到其他函数?
- javascript - 获取未定义的数组元素反应
- dart - TeleDartMessage 类的 photo 属性的长度为 4
- javascript - 如何创建一个通用的 JavaScript 函数,该函数可以运行 python 脚本并以 json 格式返回数据(如果有)?
- python-3.x - 将语料库中的名称部分匹配到 Pandas 数据框中另一列中的名称