python - 遍历 pandas 数据框或 groupby 对象
问题描述
df_headlines =
我想按date
列分组,然后按日期计算, 和出现的次数-1
,然后以计数最高的为准,将其用作.0
1
daily_score
我从一个开始groupby
:
df_group = df_headlines.groupby('date')
这将返回一个 groupby 对象,鉴于我想要在上面执行的操作,我不确定如何使用它:
我可以使用以下内容进行迭代吗?:
for index, row in df_group.iterrows():
daily_pos = []
daily_neg = []
daily_neu = []
解决方案
正如 Ch3steR 作为评论所暗示的那样,您可以通过以下方式遍历您的组:
for name, group in headlines.groupby('date'):
daily_pos = len(group[group['score'] == 1])
daily_neg = len(group[group['score'] == -1])
daily_neu = len(group[group['score'] == 0])
print(name, daily_pos, daily_neg, daily_neu)
对于每次迭代,变量name
将包含date
列中的值(例如 4/13/20、4/14/20、5/13/20),并且变量group
将包含变量中包含的所有行的date
数据name
框.
推荐阅读
- python - request.POST.get() 返回值和无
- python - Python:如何将列表列表写入文本文件?
- html - ::before 伪元素不显示
- c# - 使用 ChoETL 将 JSON 转换为 CSV 缺少一些数组值
- javascript - 如何使用 vuetity 的 v-row 和 v-col 输出 7 或 8 列网格?
- c++ - 将参数中的函数\类传递给静态库
- python - 尝试将 Discord 消息桥接到 Telegram
- php - 从一个读取并写入第二个excel文件 - PHP
- c++ - 类数组插入函数
- mysql - Prestashop SQL 修改以另一个表为条件的表