python - 比较两个不同的excel文件中的值?
问题描述
我正在用 python 编写一个程序,该程序根据用户在 reddit 上写的消息来查找用户的性别。在程序结束时,我有两个不同的文件:
有 15000 行,在同一行没有同一作者。
你知道我该如何比较它们吗?
我应该将同一作者放在同一行,但由于文件的尺寸,我对“for”有一些问题。
谢谢
解决方案
假设这些是 csv,这将对两个文件进行排序。
import pandas as pd
df1 = pd.read_csv('firstFile.csv')
df2 = pd.read_csv('secondFile.csv')
df1 = df1.sort_values(by=['author,gender'], ascending=True)
df2 = df1.sort_values(by=['author,gender'], ascending=True)
推荐阅读
- javascript - 如何使用javascript显示来自json数据文件Api Call的日期
- spring - 如何在 Spring Security JWT 身份验证中检查用户角色并获取经过身份验证的用户名
- typescript - 如何在 `deno` 中使用`serialport` 库?
- opengl - 如何实现自然模糊滤镜?(卷积核)
- database - 如何一次将 NOT NULL 设置为存在于我的数据库的所有表中的列?
- django-models - AttributeError:“元组”对象没有属性“名称”Django 错误
- php - 如何修复数组到字符串的转换错误
- python - Python,获得月收入百分比的公式
- python - 当文本不在 HTML 元素中时如何抓取文本
- xml - net.sf.saxon.s9api.SaxonApiException: XML 解析器处理报的 I/O 错误 null: null