python - 添加一个新列,其中逐行提取单词
问题描述
我需要为每列添加一个新列,其中包含满足以下条件的单词:
df['Names'].str.extractall(r'\b([A-Z][a-z]*)\b')
即字母大写的单词。
上面的代码提取了这些单词,但对于所有列,不区分行。数据的一个例子是
Names
My Lord: come le bande albanesi trafficano i g..
Viaggi di nozze 2020, i dieci eventi imperdibi..
Ma perché vi sto raccontando tutto questo, per Niente
新列应该是
Names
My Lord: come le bande albanesi trafficano i g..
Viaggi di nozze 2020, i dieci eventi imperdibi..
Ma perché vi sto raccontando tutto questo, per Niente
New
['My', 'Lord']
['Viaggi']
['Ma','Niente']
我想我应该遍历这些行。你能指出我正确的方向吗?
解决方案
您可以更改为findall
df['My'] = df['Names'].str.findall(r'\b([A-Z][a-z]*)\b')
推荐阅读
- wolfram-mathematica - 如何同时迭代两个数组并将元素放在函数中的特定位置(在 Mathematica 中)?
- java - 如何使用 okhttp 删除标头“accept-encoding:gzip”
- typescript - Nest.js: Pass the provider to the decorator
- c# - 从mysql数据库中检索数据并过滤检索到的数据的优先级
- amazon-sagemaker - 任何人都知道为什么 sagemaker 无法访问 files.fast.ai 服务器
- c# - 在 Visual Studio 上查找 Mono 版本
- arrays - 如何遍历数组并在 bash 脚本中输出某些单词?
- svn - Windows 10:使用 TortoiseSVN 和 ssh 的 svn+ssh
- android - 由于依赖错误,未生成 apk
- google-apps-script - 如何编写 Google 表单以添加链接以查看带有问题的表单提交