首页 > 解决方案 > 如何使用自定义数据集训练 BART 进行文本摘要?

问题描述

我准备了一个自定义数据集,用于训练我自己的文本摘要自定义模型。我希望使用 BART,因为它现在是最先进的。我正在使用 pytorch 使用 HuggingFace 的变压器库。

但我不知道如何自己训练模型。我尝试在以下链接上运行run_train.sh:https://github.com/huggingface/transformers/tree/master/examples/summarization/bart

我已将 CNN 数据加载到 Google Colab 中。它仍然显示错误。

有人可以帮助我如何使用迁移学习进行自定义文本摘要吗?任何其他模型也有帮助。

标签: pythonnlppytorchsummarizationhuggingface-transformers

解决方案


推荐阅读