首页 > 解决方案 > 如何从熊猫的链接中提取单词

问题描述

我需要一个用于从 HTTPs 链接中提取单词的最佳代码,这将是一个创建的新列,请让我知道最佳和快速的方法

代码 :

df['new_column'] = url
final_df['currency'] = final_df['currency'].str.replace(r'[a-z]*://[a-z]*.[a-z]*.[a-z]*/[a-z]*/', 
'').str.strip()



   

新专栏

   https://www.investing.com/currencies/usd-jpy-historical-data
   https://www.investing.com/currencies/usd-jpy-historical-data
   https://www.investing.com/currencies/usd-jpy-historical-data
   https://www.investing.com/currencies/usd-inr-historical-data
   https://www.investing.com/currencies/usd-inr-historical-data

   

结果

   usd-jpy
   usd-jpy
   usd-jpy
   usd-inr
   usd-inr



     

标签: python-3.xregexpandasdataframe

解决方案


Series.str.split与 一起使用Series.str.join

df['new_column'].str.split('/').str[-1].str.split('-').str[:2].str.join('-')

输出:

usd-jpy
usd-jpy
usd-jpy
usd-inr
usd-inr

推荐阅读