python - 如何将数据框列转换为字符串以执行 ner_chunks
问题描述
如何将数据框列转换为字符串。
摘要列由标题描述数据组成
我希望数据框列摘要转换为字符串,以便我可以提供作为 nerchunks 的输入
请注意我的数据框的标题和抽象列仅属于对象类型。
df['Abstract'] = df['Abstract'].astype(str)
df['Abstract'].head(5)
i = nltk.ne_chunk_sents(nltk.pos_tag_sents(word_tokenize(df['Abstract'])) , binary=True)
[a for a in i if len(a) == 1]
错误:
TypeError:预期的字符串或类似字节的对象
解决方案
要获取数据框的列,您可以尝试
df.columns
但是您正在寻找一个包含所有列名的字符串,并且 df.column 返回 dtype 对象。因此,您首先将 abouve 转换为列表,然后将它们简单地连接成一个字符串。干得好:
yourResult = ' '.join(list(dataset.columns))
希望它有所帮助。
推荐阅读
- python - Ubuntu 20.04“名称解析暂时失败” - 最近重新安装
- c++ - 在 C++ 中通过引用传递向量数组
- oracle-apex - Oracle APEX 中的图表行为
- node.js - 我无法为 SSR nextjs 生产创建管道
- javascript - jsp页面中输入类型文本的Javascript模式(正则表达式)
- python - 找到绘图改变斜率的点
- c# - 根据运行时配置更改 Xamarin.Forms 中的 MainPage
- ruby-on-rails - Rails 一直在寻找不存在的宝石
- java - 处理传递字符串变量时出现 NullPointerException
- javascript - 下次调用该函数时退出 Java Script 中的循环