首页 > 解决方案 > 如何使用 pushshift 获得最高分的子 reddit 提交?

问题描述

我是初学者,如果这是完全错误的,我很抱歉。到目前为止,我已经能够提供所需的字段(作者、subreddit、创建日期、评论数量、分数、提交标题、提交描述)并将其保存到数据框中。但是当复杂的问题开始时,我突然迷失了,比如这个问题以及一周中哪一天提交的内容最多。这就是我现在获得最高分的提交:

subreddit = pd.read_csv('subreddit.csv', delimiter = ',')
subreddit.count()

score = "score"
h_score = subreddit.score.max()
best_submission = subreddit.score(h_score) #it comes out as TypeError: 'Series' object is not callable here
bsubmission_title = title[best_submission]
print("Submission with the highest score:", bsubmission_title)

标签: pythonreddit

解决方案


subreddit.score.max()返回列中的最大值score。但是您想获得与该分数在同一行的标题。为了得到,您不需要分数值,而是具有最高分数值的行的索引。你可以用idxmax. 然后,您可以使用索引来获取匹配的标题:

h_score_index = subreddit.score.idxmax()
bsubmission_title = subreddit.title[h_score_index]
print("Submission with the highest score:", bsubmission_title)

推荐阅读