python-3.x - 如何从熊猫的链接中提取单词
问题描述
我需要一个用于从 HTTPs 链接中提取单词的最佳代码,这将是一个创建的新列,请让我知道最佳和快速的方法
代码 :
df['new_column'] = url
final_df['currency'] = final_df['currency'].str.replace(r'[a-z]*://[a-z]*.[a-z]*.[a-z]*/[a-z]*/',
'').str.strip()
新专栏
https://www.investing.com/currencies/usd-jpy-historical-data
https://www.investing.com/currencies/usd-jpy-historical-data
https://www.investing.com/currencies/usd-jpy-historical-data
https://www.investing.com/currencies/usd-inr-historical-data
https://www.investing.com/currencies/usd-inr-historical-data
结果
usd-jpy
usd-jpy
usd-jpy
usd-inr
usd-inr
解决方案
Series.str.split
与 一起使用Series.str.join
:
df['new_column'].str.split('/').str[-1].str.split('-').str[:2].str.join('-')
输出:
usd-jpy
usd-jpy
usd-jpy
usd-inr
usd-inr
推荐阅读
- rust - 有没有更简洁的方式来格式化 .expect() 消息?
- python - 如何处理列中的unicode值dict
- php - 使用 Angular 和 php 上传文件时面临错误
- c# - 如何从数据库中删除选定的 DataGridView 行?
- c# - 启用两因素身份验证时,基于 Netsuite 令牌的身份验证出现无效登录错误
- c - 究竟是什么打破了 main 中的 while 循环?
- npm - 我无法安装任何 npm 包
- postgresql - 即使有大量数据,Timescaledb 内存消耗仍然非常低
- scala - 如何将火花数据集转换为 scala seq
- python - 代码在不同环境下运行不同