python - 带有样本权重的 keras 自定义指标
问题描述
我正在尝试在 Keras 中定义一个考虑样本权重的自定义指标。拟合模型时,我使用的样本权重如下:
training_history = model.fit(
train_data,
train_labels,
sample_weight = train_weights,
epochs = num_epochs,
batch_size = 128,
validation_data = (validation_data, validatation_labels, validation_weights ),
)
我使用的自定义指标的一个示例是 AUC(roc 曲线下的面积),我将其定义如下:
from keras import backend as K
import tensorflow as tf
def auc(true_labels, predictions, weights = None):
auc = tf.metrics.auc(true_labels, predictions, weights = weights)[1]
K.get_session().run(tf.local_variables_initializer())
return auc
我在编译模型时使用这个指标:
model.compile(
optimizer = optimizer,
loss = 'binary_crossentropy',
metrics = ['accuracy', auc]
)
但据我所知,该指标并未考虑样本权重。事实上,我通过比较使用上面定义的自定义指标训练模型时看到的指标值与我自己根据模型输出和样本权重计算得到的指标值来验证这一点,这确实产生了非常不同的结果。我将如何定义上面显示的 auc 指标以考虑样本权重?
解决方案
sample_weights
您可以使用另一个作为参数的函数来包装您的指标:
def auc(weights):
def metric(true_labels, predictions):
auc = tf.metrics.auc(true_labels, predictions, weights=weights)[1]
K.get_session().run(tf.local_variables_initializer())
return auc
return metric
然后定义一个额外的输入占位符来接收样本权重:
sample_weights = Input(shape=(1,))
然后可以按如下方式编译您的模型:
model.compile(
optimizer = optimizer,
loss = 'binary_crossentropy',
metrics = ['accuracy', auc(sample_weights)]
)
注意:未经测试。
推荐阅读
- swift - 在 Alamofire 请求中使用 validate() 时如何处理错误?
- java - Java-允许一个线程更新一个值,其他线程等待并跳过临界区
- c - Semmle QL:TaintTracking hasFlow() 污染其参数的源的问题
- android - 状态栏在沉浸模式下保持可见
- intellij-idea - Intelij 的输入问题
- c# - 编译 C# WPF 项目时的 MessageBox
- javascript - 单选按钮选择具有相同名称的其他组按钮
- php - 使用 PHP 向 Android 应用推送通知
- java - 杰克逊禁用@JsonFormat注解
- uitabbar - 无法在 tvOS 13 上设置 UITabBarleadingAccessoryView