python - 如何使用 pushshift 获得最高分的子 reddit 提交?
问题描述
我是初学者,如果这是完全错误的,我很抱歉。到目前为止,我已经能够提供所需的字段(作者、subreddit、创建日期、评论数量、分数、提交标题、提交描述)并将其保存到数据框中。但是当复杂的问题开始时,我突然迷失了,比如这个问题以及一周中哪一天提交的内容最多。这就是我现在获得最高分的提交:
subreddit = pd.read_csv('subreddit.csv', delimiter = ',')
subreddit.count()
score = "score"
h_score = subreddit.score.max()
best_submission = subreddit.score(h_score) #it comes out as TypeError: 'Series' object is not callable here
bsubmission_title = title[best_submission]
print("Submission with the highest score:", bsubmission_title)
解决方案
subreddit.score.max()
返回列中的最大值score
。但是您想获得与该分数在同一行的标题。为了得到,您不需要分数值,而是具有最高分数值的行的索引。你可以用idxmax
. 然后,您可以使用索引来获取匹配的标题:
h_score_index = subreddit.score.idxmax()
bsubmission_title = subreddit.title[h_score_index]
print("Submission with the highest score:", bsubmission_title)
推荐阅读
- node.js - 当通过 npx 创建项目时,yarn add react-native
- microservices - 微服务架构:你能完全消除系统中服务之间的同步调用吗?
- angularjs - SassError:预期的“)”
- redis - 如何使用 StackExchange.Redis 判断连接的 Redis 是单节点还是集群模式?
- javascript - React.js 将 setState 作为 prop 传递会导致警告有关将 props 用于依赖项
- css - 从 Material UI SwipeableViews React 中移除填充
- javascript - 窗口.打印();忽略 Div 选择器
- python - Speech_recognition 无法识别我的声音或任何类似的东西
- visual-studio - Visual Studio 2019 - 查找主题元素的名称
- html - Font-Awesome 将图标加载为正方形