python - 基于列条件python pandas的填充和替换
问题描述
我有一个带有 MachineType、Prod/RT 和其他几列的 df。MachineType 包含 TRUE 或 FALSE。需要.fillna 和 .replace 但对于 MachineType 以不同的方式。(TRUE 和 FALSE 的填充值不同)
数据框:updatedDf
我的代码在计算之上:
updatedDf['Prod/RT']=updatedDf[updatedDf['MachineType']==True]['Prod/RT'].replace(np.inf,0.021660)
updatedDf['Prod/RT']=updatedDf[updatedDf['MachineType']==True]['Prod/RT'].fillna(0.021660)
updatedDf['Prod/RT']=updatedDf[updatedDf['MachineType']==False]['Prod/RT'].replace(np.inf,0.050261)
updatedDf['Prod/RT']=updatedDf[updatedDf['MachineType']==False]['Prod/RT'].fillna(0.050261)
但是我的代码给出了一个带有 Nan 值的意外输出。有什么办法可以解决这个错误吗?或者我们不能像上面那样使用 .fillna 和 .replace 吗?
解决方案
我解决问题的方法是将填充和替换包装在一个函数中,并将其用作 pandas 中的参数.apply()
。使用您的方法将需要使用.loc[]
.
updatedDf = pd.DataFrame({
'MachineType' : np.random.choice([True, False], 10, True),
'Prod/RT' : np.random.choice([np.nan, np.inf, random.random()], 10, True)
})
# solution 1
prod_RT_dict = {True:0.21660, False:0.050261}
def fillProd_RT(row):
if row['Prod/RT'] != np.inf and pd.notna(row['Prod/RT']):
return row['Prod/RT']
else:
return prod_RT_dict[row['MachineType']]
updatedDf['Prod/RT_2'] = updatedDf.apply(fillProd_RT, axis=1)
# solution 2
updatedDf['Prod/RT_3']=updatedDf['Prod/RT'].replace(np.inf,np.nan)
updatedDf.loc[updatedDf['MachineType']==True,'Prod/RT_3']=updatedDf\
.loc[updatedDf['MachineType']==True,'Prod/RT_3'].fillna(0.021660)
updatedDf.loc[updatedDf['MachineType']==False,'Prod/RT_3']=updatedDf\
.loc[updatedDf['MachineType']==False,'Prod/RT_3'].fillna(0.050261)
updatedDf
推荐阅读
- javascript - 回显页面上出现的前 5 个单词
- apache-kafka - Where to run the processing code in Kafka?
- python - Solr 服务器在使用 Pysolr 索引(数百万个文档)时不断停机
- python - 处理超过 300.000 条记录时 Python 崩溃
- azure - Xamarin.iOS如何在注册到后端以获取推送通知后获取安装ID
- android - 如何将 textView 放在回收站视图之上?
- zapier - Zapier 表单动态 inputFields 操作
- javascript - 如何使用 jQuery 将 HTML 标签添加到属性中
- javascript - Jquery Waypoints - 一个动画到多个 div
- css - Vaadin Flow 中的 Shadow Dom 风格