首页 > 解决方案 > MLFlow sklearn 自动记录在 colab 中打印太多信息消息

问题描述

我正在尝试 mlflow sklearn 自动日志记录,在 colab 中,mlflow 会打印很多信息消息,有时它会使浏览器崩溃。附上信息日志的图片mlflow 信息日志

代码在这个 colab 文件中

我不确定这里缺少什么,但是相同的代码可以正常工作,而无需在我的本地计算机上生成这些信息日志。

标签: pythonmlflow

解决方案


这是 MLFlow 包的一个已知问题,其中已引发了一个修补程序。

见这里:https ://github.com/mlflow/mlflow/pull/3978

故障描述

在 MLflow 1.13.0 和 1.13.1 中,当修补的 ML 训练函数在预先存在的 MLflow 运行中开始执行时,会发出以下 Python 事件日志消息。

不幸的是,对于打补丁的 ML 训练例程,这些例程使子调用其他已修补的 ML 训练例程(例如,在 sklearn DecisionTree 实例的集合上调用 fit() 的 sklearn 随机森林),每次调用孩子时,此事件日志都会打印到标准输出。

这会产生数百个对用户没有价值的冗余事件记录调用。


推荐阅读