python-3.x - 如何在python中并排组合两行相同的数据集?
问题描述
我有一个数据集,我想将同一数据集的前两行组合成一个数据集。原始数据集非常大,但我在这里提到了一个小例子。
df
one two three
0 T H A
1 N K S
2 F O R
3 H L P
合并前两行后,它应该如下所示:
df
one two three one two three
0 T H A N K S
我对 StackOverflow 很陌生,最近在 python 中开始了我的职业生涯。如果我的问题格式不正确,请提出修改建议。谢谢。
解决方案
您可以使用df.iloc
获取数据帧的两个切片,一个用于偶数行,另一个用于奇数行。然后pd.concat(..., axis=1)
让他们重新在一起。
注意pd.concat
将尝试在其索引(即0, 1, 2, 3
)上对齐输入数据帧,如果其中一个数据帧没有特定索引的数据,则它将填充空值。所以我们需要reset_index
得到想要的输出。
df = pd.concat(
[
df.iloc[::2].reset_index(drop=True),
df.iloc[1::2].reset_index(drop=True)
], axis=1
)
输出
one two three one two three
0 T H A N K S
1 F O R H L P
推荐阅读
- c# - 攀爬系统的网格边缘检测
- sql - ETL 包最初加载所有数据然后下次运行以仅加载更改或新项目的最佳方法
- docker - Docker Windows 10 - 如何运行 Jenkins,在 d 驱动器上绑定卷而不会出现权限错误
- python - raise HTTPError(req.full_url, code, msg, hdrs, fp) urllib.error.HTTPError: HTTP Error 403: Forbidden
- botframework - Bot Framework:使用 LUIS 处理较长电子邮件的方法(超过 500 个字符)
- excel - 替换 for 循环,以便计算非空行
- mysql - 是否可以仅通过 cpanel/phpmyadmin 访问“复制”数据库?
- apache-spark - 使用 SQL 语法过滤和在 Pyspark 中显式调用列之间的区别?
- python - 如何在 ATOM 编辑器中为每个项目设置 PYTHONPATH
- typescript - firebase 键值返回未定义