首页 > 技术文章 > pandas(五):pandas对CSV合并多个文件,分割训练集测试集

zhangxianrong 2021-06-10 11:03 原文

一、pandas对CSV合并多个文件,分割训练集测试集

def all_data(self):
    df1 = pd.read_csv("data/POI/negtive.csv")
    df2 = pd.read_csv("data/POI/positive.csv")
    df = pd.concat([df1,df2],ignore_index=True)
    df.to_csv("data/POI/all.csv",index=False,sep=',')
def split(self):
    df = pd.read_csv('data/POI/all.csv')
    df = df.sample(frac=1.0)
    cut_idx = int(round(0.2 * df.shape[0]))
    df_test, df_train = df.iloc[:cut_idx], df.iloc[cut_idx:]
    df_test.to_csv("data/POI/test.csv",index=False,sep=',')
    df_train.to_csv("data/POI/train.csv", index=False, sep=',')

 

推荐阅读