首页 > 解决方案 > NLTK POS 标签:如何将“Word”及其对应的“POS 标签”放入 DataFrame

问题描述

我有一个列表 list = ['about','above','account','address','after'] ,就像我传递给nltk pos 标记函数一样,输出看起来像这样的列表形式:

[('about', 'IN'),('above', 'JJ'),('account', 'NN'),('address', 'NN'),('after', 'IN')]

现在我需要以DataFrame的形式分别显示这些单词和 pos 标签,所以输出看起来像这样:

Words   Pos Tags
about     IN
above     JJ
account   NN
address   NN
after     IN

标签: pythonlistdataframesyntaxnltk

解决方案


这应该很容易:

In [15]: data = [('about', 'IN'),('above', 'JJ'),('account', 'NN'),('address', 'NN'),('after', 'IN')]

In [16]: df = pd.DataFrame(data, columns=['Word', 'POS'])

In [17]: df
Out[17]:
      Word POS
0    about  IN
1    above  JJ
2  account  NN
3  address  NN
4    after  IN

推荐阅读