python - 在 NER 中具有可重复的结果
问题描述
我目前正在使用库简单的转换器来执行 NER 任务。
DEFAULT_MODEL_PARAMS = {
"save_eval_checkpoints": False,
"save_steps": -1,
'overwrite_output_dir': True,
"save_model_every_epoch": False,
'reprocess_input_data': True,
"train_batch_size": 8,
'num_train_epochs': 10,
"max_seq_length": 50,
"gradient_accumulation_steps": 1,
"use_multiprocessing": True,
"manual_seed": 42,
'dataloader_num_workers': 0
}
model = NERModel('camembert', 'camembert-base',
labels=unique_labels,
use_cuda=use_cuda,
cuda_device=cuda_device,
args=DEFAULT_MODEL_PARAMS)
但是即使我在参数中修复了手动种子,我也会得到不同的结果。我也注意到我收到了这个警告
Some weights of CamembertForTokenClassification were not initialized from the model checkpoint at camembert-base and are newly initialized: ['classifier.weight', 'classifier.bias']
那么我怎样才能得到可重复的结果呢?
解决方案
推荐阅读
- javascript - reactjs路由无法正常工作
- windows - 如何使用groovy打印Windows10的用户定义变量?
- javascript - Vue,有没有办法在没有 URL 参数的路由之间传递数据?
- apache - 如何获取默认的 Apache getting-started.html?
- python-3.x - 如何正确验证 LDAP?
- mysql - MySQL:为什么使用 REPLACE 时 url 不匹配?
- pyspark - Athena 仅更新特定分区:MSCK REPAIR TABLE
- android - 制作一个可以随着屏幕尺寸和 pd 变化而缩放的 ui 的最佳方法是什么?
- php - 从 laravel 5.6 中的 sql 视图中选择
- elasticsearch - 在 bool 查询中过滤 should 的上下文