python - 如何将情感分类器应用于数据框
问题描述
我有一个包含调查答案的数据框。其中三列是开放式答案。使用 HuggingFace NLP 我正在使用预先训练的情感分析分类器。请在下面找到代码:
from transformers import AutoTokenizer, AutoModelForSequenceClassification, pipeline
model_name = "nlptown/bert-base-multilingual-uncased-sentiment"
model = AutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)
classifier = pipeline('sentiment-analysis', model=model, tokenizer=tokenizer)
classifier("This community is so helpful!")
分类器测试的结果是:“[{'label': '5 stars', 'score': 0.800311}]
我想做的是让分类器在我的开放式响应上运行,并且在我的数据框中的新列中,让它包括星星和排名分数。
任何帮助将不胜感激。
编辑:我通过本地 csv 上传了数据集。我要使用的数据框列名称是“Q72”
解决方案
在列上应用模型并使用分配函数创建另一列:
df = (
df
.assign(sentiment = lambda x: x['Q72'].apply(lambda s: classifier(s)))
.assign(
label = lambda x: x['sentiment'].apply(lambda s: (s[0]['label'])),
score = lambda x: x['sentiment'].apply(lambda s: (s[0]['score']))
)
)
推荐阅读
- python - SQL Alchemy,pymssql,Pandas 0.24.2 to_sql 试图在表已经存在时创建表
- kubernetes - kubectl minikube 更新证书
- ios - 如何在 WebView(ios,Swift)中自动播放 youtube 视频
- typescript - 避免在函数体内检查参数的正确性
- django - django migrate 在配置 mongodb 后抛出错误
- python - 错误:xlrd.biffh.XLRDError:Excel xlsx 文件;不支持
- ms-access - 将表单从编辑模式更改为新模式运行时错误 2105
- javascript - 当自定义警报声音发生时,JavaScript 中是否有任何方法可以突出显示或闪烁浏览器选项卡?
- python-3.x - 为什么这个 python 程序不将我的湿度传感器数据写入我的 SQLite 数据库 (RPI)?
- node.js - Typeorm Atlas Mongodb 无服务器实例连接错误