首页 > 解决方案 > 在 Bash 中拆分 csv 文件中的列

问题描述

我想从 csv 文件的第二列中提取值,并将提取的值存储在新列中。

我的数据集样本:

page_name      post_id                        page_id
A              86680728811_272953252761568    86680728811   
A              86680728811_273859942672742    86680728811
B              86680728033_281125741936891    86680728033
B              86680728033_10150500662053812  86680728033

我想提取下划线后面的数字并将它们存储在新列中。样本输出:

page_name      post_id                        page_id
A              272953252761568                86680728811   
A              273859942672742                86680728811
B              281125741936891                86680728033
B              10150500662053812              86680728033

我尝试使用此代码:

cat FB_Dataset.csv | sed -Ee 's/(.*)post_id/\1post_id/' -e 's/,[_ ]/,/' -e 's/_/,/'

但我没有得到想要的输出。

任何帮助表示赞赏。谢谢你。

标签: bashcsvunix

解决方案


sed 's/[0-9][0-9]*_//' < a.csv  

其中 a.csv 是
编辑原始数据以添加 [0-9]的文件


推荐阅读