首页 > 解决方案 > 添加一个新列,其中逐行提取单词

问题描述

我需要为每列添加一个新列,其中包含满足以下条件的单词:

df['Names'].str.extractall(r'\b([A-Z][a-z]*)\b')

即字母大写的单词。

上面的代码提取了这些单词,但对于所有列,不区分行。数据的一个例子是

Names
My Lord: come le bande albanesi trafficano i g..
Viaggi di nozze 2020, i dieci eventi imperdibi..
Ma perché vi sto raccontando tutto questo, per Niente

新列应该是

Names
My Lord: come le bande albanesi trafficano i g..
Viaggi di nozze 2020, i dieci eventi imperdibi..
Ma perché vi sto raccontando tutto questo, per Niente

New
['My', 'Lord']
['Viaggi']
['Ma','Niente']

我想我应该遍历这些行。你能指出我正确的方向吗?

标签: pythonpandas

解决方案


您可以更改为findall

df['My'] = df['Names'].str.findall(r'\b([A-Z][a-z]*)\b')

推荐阅读