python - 如何在熊猫数据框中将一列拆分为另一列
问题描述
我正在清理熊猫数据框中的数据,我想将一列拆分为另一列。
我想按列'eNBID'拆分列'id',但不知道如何拆分
import pandas as pd
id_list = ['4600375067649','4600375077246','460037495681','460037495694']
eNBID_list = ['750676','750772','749568','749569']
df=pd.DataFrame({'id':id_list,'eNBID':eNBID_list})
df.head()
id eNBID
4600375067649 750676
4600375077246 750772
460037495681 749568
460037495694 749569
What I want:
df.head()
id eNBID
460-03-750676-49 750676
460-03-750772-46 750772
460-03-749568-1 749568
460-03-749569-4 749569
#column 'eNBID' is the third part of column 'id', the item length in column 'eNBID' is 6 or 7.
解决方案
考虑到46003
所有ID都将保持不变
df['id'] = df.apply(lambda x: '-'.join([i[:3]+'-'+i[3:] if '460' in i else i for i in list(re.findall('(\w*)'+'('+x.eNBID+')'+'(\w*)',x.id)[0])]), axis=1)
输出
id eNBID
0 460-03-750676-49 750676
1 460-03-750772-46 750772
2 460-03-749568-1 749568
3 460-03-749569-4 749569
推荐阅读
- c# - C#通过OleDBDataReader从大型excel文件批量复制抛出内存异常
- html - 如何使我的 CSS 边框仅围绕我的链接?
- javascript - 使用函数设置 JavaScript 对象属性
- python - 姜戈 1.8。当我们在值中使用 id 字段并在 django 中注释操作时,结果 sql-query 中会忽略其他字段
- javascript - 将脚本添加到加载主体后运行的头部
- php - 如何将2个选择元素组合在一起html
- visual-studio-code - vs code 孪生页面图标消失了
- excel - 宏优化 ifs 似乎减慢了 lat
- node.js - 使用图像格式将图像保存到 s3 存储桶
- c++ - 使用重载运算符添加构造函数