tensorflow-data-validation - 如何启用数值特征漂移?
问题描述
我想在不设置域的情况下启用数值特征漂移。例如:我根据年龄对客户进行评分,在我的训练集中我有一个均匀分布的变量。现在,在我的服务数据中,所有客户都是 50 多岁(域不会捕捉到这种转变)。是否有任何选项来标记需要在 tfdv 重新培训的这种行为?
我尝试给 tfdv 两个分布 N(0,1) 和 N(10,1) 但没有检测到异常。
编辑:漂移仅适用于分类特征。
解决方案
TFDV 添加了一个新功能,允许我们检测数字特征的偏差。在 中指定jensen_shannon_divergence
阈值而不是infinity_norm
阈值skew_comparator
。
例子:
tfdv.get_feature(schema, 'total_actions').skew_comparator.jensen_shannon_divergence.threshold = 0.01
你可以在这里查看更多信息:https ://www.tensorflow.org/tfx/data_validation/get_started#checking_data_skew_and_drift
推荐阅读
- delphi - Indy IdHttp Proxy,支持哪些协议?
- powershell - 活动目录电源外壳。删除旧用户帐户
- ssl - HTTPS 连接在 TLS 握手时挂起
- ruby-on-rails - 使用 Rails 控制台用户注册进行测试,并在取决于用户注册的另一个模型中创建记录
- php - Laravel 将请求拆分为多个请求
- django - Django:外部类的集成?
- c++ - 有什么方法可以对 std::unordered_set、std::unordered_map、std::set、std::map 使用相同的函数?
- angular - 如何使用 Angular Material MAT_AUTOCOMPLETE_DEFAULT_OPTIONS 注入令牌
- c# - Nuget restore without VS with package content installation
- c# - 递归获取标记有属性的属性