python-3.x - 数据的排序和清洗
问题描述
我是这个小组的新手,我是一个崭露头角的 Python 程序员。我被一个小任务困住了,我必须完成。以下是我面临的问题。另请参阅我编写的代码。
import pandas as pd
import numpy as np
data = pd.read_csv("/Users/nancy/Desktop/sample.csv")
a = data["A"]
b = a.str.replace("First year"," ")
c = b.str.replace("First year"," ")
print (c)
data.to_csv("/Users/nancy/Desktop/sample1.csv")
我想按字母顺序对名为 X 和 Y 的列进行排序,其中 Y 列在 A、B、C、D 列中具有相同的对应值。我想用空格替换 A 列和 C 列中的“第一年”。
我可以用空格替换它。但是,我无法将新数据写入新的 csv 文件。我想用空格替换 A 列和 C 列中的“第一年和当年”,并在 B 列和 D 列中重现相同的数据
问候,南希
解决方案
您可以使用data.sort_values("your_column")
:
import pandas as pd
import numpy as np
data = pd.read_csv("sample.csv")
data["A"] = data["A"].str.replace("First year and current year"," ")
data["A"] = data["A"].str.replace("First year"," ")
data["C"] = data["C"].str.replace("First year and current year"," ")
data["C"] = data["C"].str.replace("First year"," ")
#print (data)
#print("---------------------------------------------------------------------------")
sorted_data = data.sort_values('Y')
#print(sorted_data)
sorted_data.to_csv("sample1.csv",index = False)
您可以查看此http://cmdlinetips.com/2018/02/how-to-sort-pandas-dataframe-by-columns-and-row/以查看更多示例。
推荐阅读
- javascript - JSX 将对象传递给 React 中 jsx 标记的值
- django - 计算用户在 Django 中喜欢的帖子数量
- flutter - 如何在没有 AWS cognito 身份验证的情况下使用 Flutter Amplify 访问 S3 存储桶
- python - 覆盖单个本地文件会导致操作系统错误
- docker - 如何在 Docker Swarm 中设置专用网络?
- vue.js - vue-cookies 计算属性反应性
- java - 用于 Java 应用程序的 Docker 映像中的 Selenium
- typescript - 如何定义受枚举约束的接口属性?
- unix - 使用 openSSL 验证 EU GreenPass
- mysql - MySQL 中的 GROUP BY,也考虑了创建时间戳