python - 如何使用自定义数据集训练 BART 进行文本摘要?
问题描述
我准备了一个自定义数据集,用于训练我自己的文本摘要自定义模型。我希望使用 BART,因为它现在是最先进的。我正在使用 pytorch 使用 HuggingFace 的变压器库。
但我不知道如何自己训练模型。我尝试在以下链接上运行run_train.sh:https://github.com/huggingface/transformers/tree/master/examples/summarization/bart
我已将 CNN 数据加载到 Google Colab 中。它仍然显示错误。
有人可以帮助我如何使用迁移学习进行自定义文本摘要吗?任何其他模型也有帮助。
解决方案
推荐阅读
- macos - 确定文件是否在任何 macOS 废纸篓文件夹中
- pyspark - 如何从pyspark中的出生日期计算年龄?
- c# - 复杂的 if 语句永远不会被执行
- c# - SaveChanges 后 EF Core 引用为空
- python - 如何更改 seaborn kdeplot 中的图例位置?
- python - 熊猫排序值以获取最多放置的项目
- python - 将 python 项目导入 HTML 页面
- ruby-on-rails - ActiveRecord 异常中的“安全”是什么意思?ActiveRecord::StatementInvalid: [安全] SQLite3::BusyException: 数据库被锁定
- excel - 在 B 列中添加多个名称的首字母
- python - Pandas - 来自具有多个(如果)条件的单列的数据框编辑字符串