python - `flow_from_dataframe()` 自定义预处理
问题描述
我正在尝试使用 kerasImageDataGenerator.flow_from_dataframe()
方法动态生成图像数据,因为我正在处理的数据集太大而无法一次性加载到内存中。
源图像数据文件是DICOM文件,flow_from_dataframe()
方法不支持。
是否可以(轻松)扩展flow_from_dataframe()
以处理 DICOM(或其他不受支持的)图像/输入?
也许可以在每个不受支持的文件上运行自定义预处理功能,返回标准化(窗口/光度校正)numpy 数组,然后允许ImageDataGenerator
实例继续。
我可以在自己的安装中编辑源代码,但首选可在 vanilla keras 上使用的通用解决方案,以确保可移植到其他平台(尤其是 Kaggle)!
解决方案
可以在 Keras github 问题跟踪器/功能请求中找到解决方案:https ://github.com/keras-team/keras/issues/13665
可以基于keras.utils.Sequence
超类创建自定义数据生成器。
推荐阅读
- substrate - 无效参数:无效长度 1,预期大小为 2 的元组
- c - int 和 long 的大小等于 4 个字节
- javascript - 将输入数组的表单序列化为 JSON 并将其用作 PHP 中的数组
- python - Python,cvzone - 为什么我会得到这个 ValueError?
- php - 致命错误:未捕获的 PhpOffice\PhpSpreadsheet\Reader\Exception:找不到 zip 成员
- django - 无法在自定义工具栏配置中将“ckeditor_wiris”插件集成到 django-ckeditor
- android - 膨胀类 androidx.media2.widget.VideoView 时出错
- html - 如何使用 css-grid 将元素放置在现有容器的顶部
- reactjs - 自定义颜色主题在 Bootstrap、React、SCSS 项目中无法正常工作
- swiftui - 来自 View 的 UIImage 与 onAppear 逻辑