首页 > 解决方案 > 为什么在 BiLSTM 之上使用 crf 的 pytorch 实现的边际概率来计算 CrossEntropy 损失无法训练模型

问题描述

我正在尝试在 PyTorch 中实现 BiLSTM+CRF 模型以进行命名实体识别。我使用了一些 CRF 的可用 pytorch 实现,它们通常具有返回边际概率的功能。我没有使用这些库提供的 CRF 损失,而是尝试使用边际概率和真实标签来计算 CrossEntopy 损失。损失计算正确,但模型没有学习这种损失。有什么我想念的吗?

标签: pytorchcrf

解决方案


推荐阅读