python - 使用 BERT 多标签分类生成百分比预测标签
问题描述
我目前正在处理文本数据的多标签分类任务。我有一个带有 ID 列、文本列和几列的数据框,这些列是仅包含 1 或 0 的文本标签。
我使用了该网站上提出的使用 Bert 的 Kaggle 有毒评论分类的现有解决方案,该解决方案允许以百分比表示其属于每个标签的程度。
现在,我已经训练了我的模型,我想将我的模型与新的未标记文本一起使用,以获得属于每个标签的百分比:
我在这个网站上找到了这个解决方案,尤其是我想在我的 Kaggle 代码末尾添加的部分代码:
texts = [
'.........',
'.........',
'..........',
'..........',
]
for text in texts:
ids, segments = tokenizer.encode(text, max_len=SEQ_LEN)
inpu = np.array(ids).reshape([1, SEQ_LEN])
predicted = (model.predict([inpu,np.zeros_like(inpu)]) >= 0.5).astype(int)
labels = [
label
for i, label in enumerate(labels_ordered)
if predicted[0][i]
]
print ("%s: %s" % (text, labels))
但是这个解决方案只允许我获得类预测,而不是每个类的百分比预测。
你知道我该怎么做才能使最后一段代码适应我的 Kaggle 代码并获得百分比预测吗?
解决方案
推荐阅读
- c++ - 如何检查派生类的类型?(C++ 实例)
- autohotkey - WinActivate 无法按预期工作。将焦点重新激活到起始窗口
- mysql - 在 perl 中从 GCE 远程连接到 Google Cloud SQL 时出错
- python - Alembic 无法删除 server_default
- wordpress - 是否可以使用 polylang 免费版翻译 woocommerce?
- reactjs - 如何覆盖 nav-dropdown @coreui/react
- php - AWS S3 文件上传但存储桶中的文件没有大小?
- spring-boot - Hibernate/JPA 无法将父级的 id 设置为子级的候选键
- sql - 在 Postgres 中将多列合并为一列
- hibernate - Hibernate JPA EntityManager 可能导致性能问题?