首页 > 解决方案 > 从 Pandas DF 中的特定格式中提取数据

问题描述

我有一个 csv 格式的原始数据,如下所示:

product-name brand-name rating

["Whole Wheat"] ["bb Royal"] ["4.1"]

预期输出:

product-name brand-name rating

Whole Wheat bb Royal 4.1

我希望这会影响我数据集中的每个条目。我有 10,000 行数据。我怎样才能使用熊猫做到这一点?我们可以使用正则表达式来做到这一点吗?不知道该怎么做。

谢谢你。

编辑 1:我的数据看起来像这样:

df = {
'product-name': [
[""'Whole Wheat'""], [""'Milk'""] ],

'brand-name': [
[""'bb Royal'""], [""'XYZ'""] ],

'rating': [
[""'4.1'""], [""'4.0'""] ]
 }
df_p = pd.DataFrame(data=df)

它的输出如下: ["bb Royal"]

PS:为我的编程道歉。我对编程和这个社区都很陌生。我真的很感谢你在这里的帮助:)

标签: pythonpandasdataframe

解决方案


IIUC 选择列表的第一个值:

df = df.apply(lambda x: x.str[0])

或者如果值是字符串:

df = df.replace('[\[\]]', '', regex=True)

推荐阅读