首页 > 解决方案 > 如何将数据框列转换为字符串以执行 ner_chunks

问题描述

如何将数据框列转换为字符串。

摘要列由标题描述数据组成

我希望数据框列摘要转换为字符串,以便我可以提供作为 nerchunks 的输入

请注意我的数据框的标题和抽象列仅属于对象类型。

df['Abstract'] = df['Abstract'].astype(str)
df['Abstract'].head(5)




i = nltk.ne_chunk_sents(nltk.pos_tag_sents(word_tokenize(df['Abstract'])) , binary=True)
[a for a in i if len(a) == 1]

错误:

TypeError:预期的字符串或类似字节的对象

标签: pythonnltknamed-entity-recognition

解决方案


要获取数据框的列,您可以尝试

df.columns

但是您正在寻找一个包含所有列名的字符串,并且 df.column 返回 dtype 对象。因此,您首先将 abouve 转换为列表,然后将它们简单地连接成一个字符串。干得好:

yourResult = ' '.join(list(dataset.columns))

希望它有所帮助。


推荐阅读