首页 > 解决方案 > Textacy 关键字返回空列表

问题描述

我想使用 textacy 提取关键术语,但我使用的函数 keyterms.key_terms.pagerank(doc) 只是返回一个空列表。

我已经尝试过相关功能,包括更长的 keyterms.key_terms_from_semantic_network(doc) 但没有成功。我也尝试使用比下面显示的更长的文本,但它仍然没有找到任何关键术语。textacy 中的其他功能似乎确实有效,因此它似乎只是 keyterms 类的问题。

import spacy
import textacy
test_string = "Textacy key term extraction is not working properly. Textacy is built on top of SpaCy."
doc = textacy.make_spacy_doc(test_string)
textacy.keyterms.textrank(doc)

我得到一个空列表,而不是一个包含术语和排名分数的元组列表。

标签: pythonnlpspacytextacy

解决方案


这是一个示例,使用 2021 年 6 月的最新版本:

import spacy
from textacy.extract import keyterms as kt

test_string = "Textacy key term extraction is not working properly. Textacy is built on top of SpaCy."
doc = textacy.make_spacy_doc(test_string, lang='en_core_web_sm')
kt.textrank(doc)

推荐阅读