首页 > 解决方案 > 熊猫字符串中的多个拆分

问题描述

将reviews_list 功能拆分为两个功能

name            reviews_list
Jalsa           [('Rated 4.0', 'RATED\n A beautiful place to ...
Spice Elephant  [('Rated 4.0', 'RATED\n Had been here for din...
San Churro Cafe [('Rated 3.0', "RATED\n Ambience is not that ...

以上是head()我的具有 2 个功能的数据框namereviews_list. 我想将该功能reviews_list分为两个功能:

  1. 只有评级 (4.0, 3.0)
  2. 只有客户的评论,即(一个美丽的地方......,一直在这里用餐......,氛围不是......)
  3. 删除:[('额定,'额定\n

标签: pythonpandas

解决方案


reviews_list从您的示例中,您的列中似乎有一个 CSV 。因此,假设您已将数据读入名为的 DataFrame 中,类似的方法应该可以工作frame

import csv
RATED_INDEX, TEXT_INDEX = 0, 1

reader = csv.reader(frame.reviews_list.values) 
next(reader)
good_list = [[float(r[RATED_INDEX].split(' ')[1]), '\n'.join(r[TEXT_INDEX].split('\n')[1:])] for r in reader]

它适用于您所展示的内容。


推荐阅读