首页 > 解决方案 > `flow_from_dataframe()` 自定义预处理

问题描述

我正在尝试使用 kerasImageDataGenerator.flow_from_dataframe()方法动态生成图像数据,因为我正在处理的数据集太大而无法一次性加载到内存中。

源图像数据文件是DICOM文件,flow_from_dataframe()方法不支持。

是否可以(轻松)扩展flow_from_dataframe()以处理 DICOM(或其他不受支持的)图像/输入?

也许可以在每个不受支持的文件上运行自定义预处理功能,返回标准化(窗口/光度校正)numpy 数组,然后允许ImageDataGenerator实例继续。

我可以在自己的安装中编辑源代码,但首选可在 vanilla keras 上使用的通用解决方案,以确保可移植到其他平台(尤其是 Kaggle)!

标签: pythonkerascomputer-visionmedical-imaging

解决方案


可以在 Keras github 问题跟踪器/功能请求中找到解决方案:https ://github.com/keras-team/keras/issues/13665

可以基于keras.utils.Sequence超类创建自定义数据生成器。


推荐阅读