首页 > 解决方案 > 计算每个数据框行中表情符号的数量

问题描述

文本

0 me así se ds 你好 ‍</p>

1 me así se ds 你好

2 自我介绍

3 我是

我想根据每行中表情符号的数量在上面的数据框 (df) 中添加一列,称为“表情符号计数”。

例如,第一行的计数为 7,因为该行中有 7 个表情符号。

我知道要根据“文本”列中的信息创建一个新列,我将输入:

df["Emoji Count"] = df["Text].....

我能够创建一个计算表情符号数量的函数,但我无法将其应用于我的数据框:

def split_count(info):

    emoji_list = []
    data = regex.findall(r'\X', info)
    for word in data:
        if any(char in emoji.UNICODE_EMOJI for char in word):
            emoji_list.append(word)

    return len(emoji_list)

标签: pythonpandasdataframeemoji

解决方案


做就是了:

df["Emoji Count"] = df.Text.apply(split_count)

或者

df["Emoji Count"] = df['Text'].apply(split_count)

这会将您的功能应用于每个单元格,并将结果分配回 Emoji Count 列。


推荐阅读