python - 熊猫字符串中的多个拆分
问题描述
将reviews_list 功能拆分为两个功能
name reviews_list
Jalsa [('Rated 4.0', 'RATED\n A beautiful place to ...
Spice Elephant [('Rated 4.0', 'RATED\n Had been here for din...
San Churro Cafe [('Rated 3.0', "RATED\n Ambience is not that ...
以上是head()
我的具有 2 个功能的数据框name
和reviews_list
. 我想将该功能reviews_list
分为两个功能:
- 只有评级 (4.0, 3.0)
- 只有客户的评论,即(一个美丽的地方......,一直在这里用餐......,氛围不是......)
- 删除:[('额定,'额定\n
解决方案
reviews_list
从您的示例中,您的列中似乎有一个 CSV 。因此,假设您已将数据读入名为的 DataFrame 中,类似的方法应该可以工作frame
:
import csv
RATED_INDEX, TEXT_INDEX = 0, 1
reader = csv.reader(frame.reviews_list.values)
next(reader)
good_list = [[float(r[RATED_INDEX].split(' ')[1]), '\n'.join(r[TEXT_INDEX].split('\n')[1:])] for r in reader]
它适用于您所展示的内容。
推荐阅读
- typescript - 我可以从输入参数推断类型吗?
- python - 如果令牌无效,如何更改 Prometheus 错误消息?
- r - R中到道路(空间线)的距离
- html - 如何在移动设备上从 PC 测试 HTML/CSS 文件
- java - 当单个应用程序实例中的基础设施问题时,Kafka 分区被阻塞
- excel - 如何立即将文本框中的值添加到列表框中五次?
- apache-spark - 使用 Spark 将 json 数组更改为数据框
- mendeley - 如何将目录树导入参考管理软件并同步论文
- google-apps-script - 未知函数:'getFontColor'
- r - 编写函数以帮助合并到不同的数据集