python - 从 Pandas DF 中的特定格式中提取数据
问题描述
我有一个 csv 格式的原始数据,如下所示:
product-name brand-name rating
["Whole Wheat"] ["bb Royal"] ["4.1"]
预期输出:
product-name brand-name rating
Whole Wheat bb Royal 4.1
我希望这会影响我数据集中的每个条目。我有 10,000 行数据。我怎样才能使用熊猫做到这一点?我们可以使用正则表达式来做到这一点吗?不知道该怎么做。
谢谢你。
编辑 1:我的数据看起来像这样:
df = {
'product-name': [
[""'Whole Wheat'""], [""'Milk'""] ],
'brand-name': [
[""'bb Royal'""], [""'XYZ'""] ],
'rating': [
[""'4.1'""], [""'4.0'""] ]
}
df_p = pd.DataFrame(data=df)
它的输出如下: ["bb Royal"]
PS:为我的编程道歉。我对编程和这个社区都很陌生。我真的很感谢你在这里的帮助:)
解决方案
IIUC 选择列表的第一个值:
df = df.apply(lambda x: x.str[0])
或者如果值是字符串:
df = df.replace('[\[\]]', '', regex=True)
推荐阅读
- reactjs - 命名空间 React 没有导出的成员“节点”
- python - 在 PYTHON 中使用动态数字键盘虚拟键盘的网站上使用 selenium 输入密码
- android - 有没有办法只对数据类类型进行扩展功能?
- regex - 从 PostgreSQL 的字段中提取字符串 + 数字
- filter - 如何访问 web.xml 中 catalina 中声明的变量
- sql - TSQL - 使用 TotalCounter 和 Pagination 连接两个表
- python - 如何在 Pandas 的前后行索引之间有效地取平均值
- joomla - 如何在不使用 JS 的情况下向 Joomla 添加自定义 HTML 属性?
- java - 使用 cron-utils 的特定日期的 Cron 表达式
- c# - 如何使用反射调用接受 lambda 输入的通用方法