首页 > 解决方案 > 如何根据“描述列”创建“类别”列

问题描述

我正在处理一个带有“描述”列的银行交易数据集,其中包含一个描述交易的短语。我想将数据集中的类似交易分组在类别下。

例如,如果交易 1 的描述 =“Roger - B111”,交易 2 的描述 =“互联网账单 293290”,那么我想将它们的描述都更改为“电信”。

我正在寻找的最终结果是一个名为“交易类别”的新列,该列将具有不同的类别级别(食品、电信、账单)。

关于这样做的最佳方法的任何想法?

标签: pythonsqldataframe

解决方案


您可以使用case,但您必须弄清楚逻辑:

select t.*,
       (case when description in ('Roger - B111', 'Internet bill 293290')
             then 'Telecommunication'
             . . .
        end) as category
from t;

推荐阅读