首页 > 解决方案 > 数据的排序和清洗

问题描述

我是这个小组的新手,我是一个崭露头角的 Python 程序员。我被一个小任务困住了,我必须完成。以下是我面临的问题。另请参阅我编写的代码。

import pandas as pd
import numpy as np
data = pd.read_csv("/Users/nancy/Desktop/sample.csv")
a = data["A"]
b = a.str.replace("First year"," ")
c = b.str.replace("First year"," ")
print (c)
data.to_csv("/Users/nancy/Desktop/sample1.csv")

我想按字母顺序对名为 X 和 Y 的列进行排序,其中 Y 列在 A、B、C、D 列中具有相同的对应值。我想用空格替换 A 列和 C 列中的“第一年”。

我可以用空格替换它。但是,我无法将新数据写入新的 csv 文件。我想用空格替换 A 列和 C 列中的“第一年和当年”,并在 B 列和 D 列中重现相同的数据

问候,南希

在此处输入图像描述

标签: python-3.xdata-cleaningcolumnsorting

解决方案


您可以使用data.sort_values("your_column")

import pandas as pd
import numpy as np
data = pd.read_csv("sample.csv")
data["A"] = data["A"].str.replace("First year and current year"," ")
data["A"] = data["A"].str.replace("First year"," ")
data["C"] = data["C"].str.replace("First year and current year"," ")
data["C"] = data["C"].str.replace("First year"," ")
#print (data)
#print("---------------------------------------------------------------------------")
sorted_data = data.sort_values('Y')
#print(sorted_data)
sorted_data.to_csv("sample1.csv",index = False)

您可以查看此http://cmdlinetips.com/2018/02/how-to-sort-pandas-dataframe-by-columns-and-row/以查看更多示例。


推荐阅读