python - 运行 run_seq2seq.py Transformers 训练脚本时出错
问题描述
我正在尝试训练一个 seq2seq 模型。我在 Colab 中运行了示例代码:
!git clone https://github.com/huggingface/transformers
!git clone https://github.com/huggingface/datasets
!pip install transformers
!pip install datasets
!python transformers/examples/seq2seq/run_seq2seq.py \
--model_name_or_path t5-small \
--do_train \
--do_eval \
--task summarization \
--dataset_name xsum \
--output_dir /tmp/tst-summarization \
--per_device_train_batch_size=4 \
--per_device_eval_batch_size=4 \
--overwrite_output_dir \
--predict_with_generate \
--max_train_samples 500 \
--max_val_samples 500
并得到了这个错误
I tensorflow/stream_executor/platform/default/dso_loader.cc:49] Successfully opened dynamic library libcudart.so.11.0
Traceback (most recent call last):
File "transformers/examples/seq2seq/run_seq2seq.py", line 47, in <module>
from transformers.file_utils import is_offline_mode
ImportError: cannot import name 'is_offline_mode' from 'transformers.file_utils' (/usr/local/lib/python3.7/dist-packages/transformers/file_utils.py)
有任何想法吗?
解决方案
问题是您克隆了存储库的主分支并尝试run_seq2seq.py
使用该主分支后面的转换器版本(4.3.3)运行脚本。
run_seq2seq.py
is_offline_mode
已在 3 月 6 日通过此合并更新为导入。
您需要做的就是克隆用于您使用的变形金刚版本的分支:
!git clone --branch v4.3.3-release https://github.com/huggingface/transformers
PS:我认为您不需要克隆数据集库。
推荐阅读
- python - Django FormView 在成功 POST 时不重定向
- c# - LLBLGen 通过非主键的字段加载不同的项目
- excel - 如何在代码中隐藏/加密 Excel VBA cdo 电子邮件密码?
- c# - 在 SSIS 脚本任务中更新 Excel 文件的格式
- java - 如何在java中分发oracle事务以进行长时间运行的查询
- node.js - 在节点中使用 readFileSync 缓存 SSL 文件,而不是每次都读取它们
- git - 如何防止 git 提交一组特定的本地更改
- c# - 当唯一的区别是可选参数时,为什么 C# 允许重载?
- flutter - 有什么方法可以打开或关闭设备位置?
- javascript - 带有收音机和选择输入的引导箱自定义对话框