首页 > 解决方案 > 熊猫 - 将熊猫数据框与分类相乘

问题描述

我正在尝试实现一种名为mix-up的方法。这是您将凸组合应用于数据特征的地方

xk = L*xi+(1-L)*xj

yk = L*yi+(1-L)*yj

例如,如果我有这个假数据:

x = [0, 1, 0]
y = [2.0, 3.5, 8]

其中 xdtypecategoricalydtypefloat。然后我对前 2 行进行采样并应用混合。假设L是0.5。0(0.5) + 1(0.5)=0.5= new x and new y = 2*(0.5) + 3.5*(0.5) = 2.75 所以它会创建一个 x=0.5 和 dy=2.75 的新行

其中 x 是特征,y 是回归情况下的标签。我将分类特征转换为数字,现在我尝试将混合应用到所有特征,即使它们是分类特征。但我得到这个错误TypeError: unsupported operand type(s) for *: 'Categorical' and 'Categorical'。通过缩放它然后添加另一个缩放的分类来修改分类是很奇怪的,但是这个算法是如何工作的,这是唯一的方法。我怎样才能强制乘以这些功能?

标签: pythonpandas

解决方案


推荐阅读