python - 计数值,使用 Pandas 保留重复项
问题描述
我有这个 ID 数据集,位于 GUID 的 A 列(250,000 个值)。我需要计算该列中每个 GUID 出现的次数,然后将其作为数据集中的另一列包含在内。问题是使用带有熊猫的 .value_counts() 给了我一个列表,但删除了重复项。由于我想将新计数数据集与旧数据集对齐,因此列表不对齐。
import os
import pandas as pd
path = (r"D:\\Users\\cdoyle\Desktop\\Final2_.xlsx")
df = pd.read_excel(path)
df = df[['Data BoundingBoxGUID', 'Data Line', 'Data Remove Item:', 'Data Status:', 'Model']]
df2 = df['Data BoundingBoxGUID'].value_counts()
df_output = pd.concat([df,df2], axis=1)
解决方案
我们通常做transform
df['new'] = df.groupby('Data BoundingBoxGUID')['Data BoundingBoxGUID'].transform('count')
推荐阅读
- c - 尝试在循环语句内的开关中获取多个输入时出错
- python - 有人可以解释一下 __init 或 __init__ 有什么区别(一个之前只有两个下划线,另一个有四个下划线)?
- inno-setup - 威瑞信时间戳服务器是否已关闭?
- pytorch - 如何从 Transformer 中减少 Helsinki-NLP/opus-mt-es-en(翻译模型)的推理时间
- reactjs - 列表中的每个孩子都应该有一个唯一的“关键”道具。如何知道使用单词“key”而不是“key2”
- python - Python3 Playsound Tkinter 代码未按预期顺序运行
- android - Android:Livedata Observer 永远不会被调用,recylerview 列表永远不会提交,navgraphviewmodel
- python - 在 Python 中模拟多个给定多个概率的最快方法?
- java - AAPT:错误:找不到属性 startIconDrawable
- php - 在 Woocommerce 中的特定国家/地区的购物车和结帐总额后显示文本