python - SpaCy 自定义 NER 训练 AttributeError:“DocBin”对象没有属性“to_disk”
问题描述
我想使用 spaCy v3 训练一个自定义 NER 模型我准备了我的训练数据并使用了这个脚本
import spacy
from spacy.tokens import DocBin
nlp = spacy.blank("en") # load a new spacy model
db = DocBin() # create a DocBin object
for text, annot in tqdm(TRAIN_DATA): # data in previous format
doc = nlp.make_doc(text) # create doc object from text
ents = []
for start, end, label in annot["entities"]: # add character indexes
span = doc.char_span(start, end, label=label)
if span is None:
pass
else:
ents.append(span)
doc.ents = ents # label the text with the ents
db.add(doc)
db.to_disk("./train.spacy") # save the docbin object
然后它打印这个错误:
AttributeError: 'DocBin' object has no attribute 'to_disk'
解决方案
确保你真的在使用 spaCy 3,以防万一:)
您可以通过运行从控制台检查这一点python -c "import spacy; print(spacy.__version__)"
通过在 python 环境中通过命令行发出pip install spacy==3.0.6
,然后在 python 控制台中运行
import spacy
from spacy.tokens import DocBin
nlp = spacy.blank("en") # load a new spacy model
db = DocBin() # create a DocBin object
# omitting code for debugging purposes
db.to_disk("./train.spacy") # save the docbin object
你应该没有错误。
推荐阅读
- python - 快速从 Python 列表中删除异常值?
- graphql - HyperGraphQL- Federating the SPARQL across multiple services
- css - Bulma align button at the bottom of a column
- javascript - 带有文本和不同颜色的圆形范围滑块
- node.js - 获取使用 Playwright 启动的浏览器的 pid
- clickhouse - 当一个副本在分片中关闭时插入可用性
- visual-studio-code - 在 Visual Studio Code 上运行 Fortran 时遇到问题
- xaml - 为什么此 XAML 行为不同?离开应用程序窗口 UWP 的元素
- c - 关于 C 语言中 printf("%f",5/4) 的愚蠢问题
- pyspark - 如何规范化pyspark中的数据框?