python - 如何在python中用条件填充空值?
问题描述
我有一个数据框
import pandas as pd
import numpy as np
df = pd.DataFrame(np.nan, index=range(1,19), columns=['A','B','C','D','E','F','G','H'])
a = [1550, 41, 9.41, 22.6, 4.74, 3.2, 11.64, 2.23]
b = [1540, 43, 9.41, 22.3, 4.84, 3.12, 11.64, 2.23]
c = [1590, 39, 9.41, 23.7, 4.74, 3.0, 11.64, 2.23]
d = [1540, 41, 9.41, 22.5, 4.74, 3.2, 11.64, 2.23]
e = [1580, 32, 9.27, 22.8, 4.82, 2.7, 12.2, 2.50]
f = [1550, 30, 9.00, 20, 4.50, 2.5, 10, 2.00]
df.loc[[1,8,13,15,16,18],:] = [a,b,c,d,e,f]
看起来像这样
A B C D E F G H
1 1550.0 41.0 9.41 22.6 4.74 3.20 11.64 2.23
2 NaN NaN NaN NaN NaN NaN NaN NaN
3 NaN NaN NaN NaN NaN NaN NaN NaN
4 NaN NaN NaN NaN NaN NaN NaN NaN
5 NaN NaN NaN NaN NaN NaN NaN NaN
6 NaN NaN NaN NaN NaN NaN NaN NaN
7 NaN NaN NaN NaN NaN NaN NaN NaN
8 1540.0 43.0 9.41 22.3 4.84 3.12 11.64 2.23
9 NaN NaN NaN NaN NaN NaN NaN NaN
10 NaN NaN NaN NaN NaN NaN NaN NaN
11 NaN NaN NaN NaN NaN NaN NaN NaN
12 NaN NaN NaN NaN NaN NaN NaN NaN
13 1590.0 39.0 9.41 23.7 4.74 3.00 11.64 2.23
14 NaN NaN NaN NaN NaN NaN NaN NaN
15 1540.0 41.0 9.41 22.5 4.74 3.20 11.64 2.23
16 1580.0 32.0 9.27 22.8 4.82 2.70 12.20 2.50
17 NaN NaN NaN NaN NaN NaN NaN NaN
18 1550.0 30.0 9.00 20.0 4.50 2.50 10.00 2.00
2,3,4,5,6,7中的空值应该用Average(1st row, 8th row)填充
9,10,11,12中的空值应该用Average(第8行和第13行)填充
第14行的空值应该用Average(第13行和第15行)填充
第17行的空值应该用Average(第16行和第18行)填充
我有一个包含 5000 行的数据框。我希望以这种方式填充空值。
解决方案
您可以尝试ffill
+ bfill
,然后取平均值
df = (df.ffill()+df.bfill())/2
推荐阅读
- docker - 如何在 GCP 中容器操作系统映像的启动脚本中使用 gsutil?
- sql - 使用列的备用名称时标识符无效
- r - Knit & rmarkdown::render() 产生不同的结果(kable 格式;PDF)
- python - 叶热图/绘图
- python - 如何从 python 中的 shuffle abcd 中去洗牌?
- unix - awk系统中的单引号
- python - 为什么情节不保存?
- magento - Magento 1.9.x 将网站从共享服务器移动到 Amazon ec2 实例
- c# - 将字典值添加为字符串列表
- css - div 的 SVG 背景模糊,设置了 backgroundColor