python - 如何加入 2 个熊猫数据框并添加相应数据框的表示列
问题描述
假设我有 2 个数据框
- 假新闻
- 真实新闻
它们都有相似的列,如标题、主题、文本、日期
现在我想将这两个数据框添加到一个中,并添加一个额外的列
Validity
,其值将是1
如果它是真实新闻,0
如果它是假新闻
解决方案
假设您有 2 个以下源 DataFrame:
real_df:
title subject text date 0 Real_title_1 Real_subject_1 Real_text_1 2020-03-01 1 Real_title_2 Real_subject_2 Real_text_2 2020-03-03
fake_df:
title subject text date 0 Fake_title_1 Fake_subject_1 Fake_text_1 2020-03-04 1 Fake_title_2 Fake_subject_2 Fake_text_2 2020-03-06
要将它们与“原产地标签”连接起来,您可以使用:
df = pd.concat([real_df, fake_df], keys=[1, 0])
结果(现在)是:
title subject text date
1 0 Real_title_1 Real_subject_1 Real_text_1 2020-03-01
1 Real_title_2 Real_subject_2 Real_text_2 2020-03-03
0 0 Fake_title_1 Fake_subject_1 Fake_text_1 2020-03-04
1 Fake_title_2 Fake_subject_2 Fake_text_2 2020-03-06
其中原始标签位于多索引的顶层。
要将其转换为“常规”列并为其指定所需的名称,请运行:
df = df.reset_index(level=0).reset_index(drop=True).rename(columns={'level_0': 'Validity'})
现在结果如你所愿,即:
Validity title subject text date
0 1 Real_title_1 Real_subject_1 Real_text_1 2020-03-01
1 1 Real_title_2 Real_subject_2 Real_text_2 2020-03-03
2 0 Fake_title_1 Fake_subject_1 Fake_text_1 2020-03-04
3 0 Fake_title_2 Fake_subject_2 Fake_text_2 2020-03-06
推荐阅读
- visual-studio-code - Visual Studio Code 扩展不起作用
- flutter - Flutter:无法从基于持久底部导航栏的视图转到登录视图
- elasticsearch - 忽略 Elasticsearch 映射
- php - 访客详细信息(http 用户代理)适用于 Android 版本 10 及更高版本
- spring - Spring升级:Spring集成JMS java.lang.AbstractMethodError:org.springframework.integration.config.xml.AbstractRouterParser.parseRouter
- google-cloud-platform - 负载测试时需要帮助进行登录身份验证oauth2.0
- css - Vimeo 视频覆盖未在视频全屏上显示
- php - 教义实体设计 - 关联
- php - 如何在 Wordpress PHP 中将 graphQL 字段添加到子级项
- sql - 用于查找匹配字符串的 SQL 正则表达式