python - 计算每个数据框行中表情符号的数量
问题描述
文本
0 me así se ds 你好 </p>
1 me así se ds 你好
2 自我介绍
3 我是
我想根据每行中表情符号的数量在上面的数据框 (df) 中添加一列,称为“表情符号计数”。
例如,第一行的计数为 7,因为该行中有 7 个表情符号。
我知道要根据“文本”列中的信息创建一个新列,我将输入:
df["Emoji Count"] = df["Text].....
我能够创建一个计算表情符号数量的函数,但我无法将其应用于我的数据框:
def split_count(info):
emoji_list = []
data = regex.findall(r'\X', info)
for word in data:
if any(char in emoji.UNICODE_EMOJI for char in word):
emoji_list.append(word)
return len(emoji_list)
解决方案
做就是了:
df["Emoji Count"] = df.Text.apply(split_count)
或者
df["Emoji Count"] = df['Text'].apply(split_count)
这会将您的功能应用于每个单元格,并将结果分配回 Emoji Count 列。
推荐阅读
- javascript - axios TypeError:无法读取快递中未定义的属性“协议”
- google-apps-script - 在插件中从 Google Appscript 激活电子表格选项卡
- orgchart - 构建数据集来自 sql 的组织树视图
- pywinauto - PyWinAuto 如何在登录失败后将焦点设置在弹出的错误消息上
- firebase - dart端如何存储flutter消息数据消息
- django - Django是表格没有出现
- python - 调整numpy数组的大小
- azure-ad-b2c - ADB2C 拆分注册页面流程
- java - 这两种处理异常的方式有什么区别
- python - 为什么模型的分数与我的 XGBoost 模型中的 f1 分数不同