python - 在 simpletransformers 中为 NER 使用 CoNLL 数据格式时出现类型错误
问题描述
我正在尝试使用大约 530 Mb 的数据构建自定义 NER。我使用以下代码使用 simpletransformers 来实现它。
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
import pandas as pd
from simpletransformers.ner import NERModel,NERArgs
import os
label = ['B-ORG', 'I-ORG', 'B-PER', 'I-PER']
args = NERArgs()
args.num_train_epochs = 10
args.learning_rate = 0.001
args.overwrite_output_dir =True
args.train_batch_size = 32
args.eval_batch_size = 32
args.lazy_loading = True
model = NERModel('roberta', 'roberta-base',labels=label, args =args, use_cuda=True)
model.train_model('a.txt',eval_data = 'b.txt', acc = accuracy_score)
我args.lazy_loading=True
用来解决内存问题。但是给出以下错误:
TypeError: convert_example_to_feature() missing 14 required positional arguments: 'label_map', 'max_seq_length', 'tokenizer', 'cls_token_at_end', 'cls_token', 'cls_token_segment_id', 'sep_token', 'sep_token_extra', 'pad_on_left', 'pad_token', 'pad_token_segment_id', 'pad_token_label_id', 'sequence_a_segment_id', and 'mask_padding_with_zero'
CoNLL 格式的示例输入文本:
a B-PER
b I-PER
c I-PER
f B-ORG
g I-ORG
h I-ORG
解决方案
推荐阅读
- python - 如何在pygame中触摸图像后结束游戏
- javascript - 在 Ajax 请求中访问 JavaScript 变量,以便在另一个函数中使用?
- javascript - 为什么我不断收到此错误?未捕获的类型错误:无法读取 null 的属性“classList”
- r - flexdashboard 的一部分永久处于“深色模式”,而整个仪表板处于“浅色模式”。我怎样才能改变它?
- angular - 如何在不刷新页面的情况下更新 Angular 中的旧版本 Service Worker?
- ios - 如何在 12.0.0 版本中使用 AppEvents.activateApp()
- ios - MacOS 更新引发 EXC_BAD_ACCESS (SIGSEGV)
- google-apps-script - 数据验证中的最小阶数和倍数
- imagej - 在 ImageJ 中运行宏时出现未定义的变量错误
- c# - 在新的 Asp.net Core SignalR 中替换 Globalhost.Dependency 解析器