首页 > 解决方案 > 比较两个不同的excel文件中的值?

问题描述

我正在用 python 编写一个程序,该程序根据用户在 reddit 上写的消息来查找用户的性别。在程序结束时,我有两个不同的文件:

在此处输入图像描述

有 15000 行,在同一行没有同一作者。

你知道我该如何比较它们吗?

我应该将同一作者放在同一行,但由于文件的尺寸,我对“for”有一些问题。

谢谢

标签: pythonexcel

解决方案


假设这些是 csv,这将对两个文件进行排序。

import pandas as pd


df1 = pd.read_csv('firstFile.csv')
df2 = pd.read_csv('secondFile.csv')

df1 = df1.sort_values(by=['author,gender'], ascending=True)
df2 = df1.sort_values(by=['author,gender'], ascending=True)

推荐阅读