image - 如何使用机器学习/视觉功能在胶片扫描中查找帧?
问题描述
我最近开始从事胶片摄影。工作流程的一部分是使用平板扫描仪扫描图像。不幸的是,这个过程非常缓慢。使用一些软件(Silverfast)进行预扫描,放大进行更详细的预扫描,单击广告拖动突出显示帧的矩形,执行 12 帧,然后将软件设置为进行全分辨率扫描。
我想自动化这个过程。我想扫描整个胶片条,而不是布局每一帧的位置,然后使用 ML.Net 查找每一帧(左上角的 X、Y 坐标),然后将其传递给 ImageMagick 以提取实际图像.
我想使用 ML.Net,因为我是一名 .Net 开发人员,以后可能有机会使用这种体验。因此,尽管欢迎使用 OpenCV 的示例,但 ML.Net 会更可取。
在 ML 方面,我有点菜鸟。我的第一个想法是尝试训练一个神经网络,输入扫描图像并输出 X 和 Y 值。然而,这似乎很幼稚(因为图像大小为 100 MB)。我想有比原始神经网络更好的工具。
我对“机器学习对象识别”的搜索似乎没有帮助,因为我发现的示例是关于在图像而不是“框架”中查找狗或人;这可能是一只狗或一个人。
即使是指向正确方向的指针,该问题的正确名称也会有很大帮助。
那么,我应该使用什么类型的工具/功能来尝试使用 ML.net 解决此类问题?
解决方案
这与其说是机器学习问题,不如说是图像处理问题。我认为 ML.Net 有点矫枉过正。
您可能想要的是一个图像处理库并利用某种形式的边缘检测或“感兴趣区域”检测。
例如,看这个问题: Detect display corners with Emgu
也许我误解了你想做什么,而你实际上会从机器学习中受益;那么您可能应该在将图像输入模型之前使用图像处理库对图像进行预处理。
希望能帮助到你。
推荐阅读
- selenium - Selenium 不会在无限滚动网页上滚动到末尾
- c++ - 不知道怎么做模板
- c# - 关于测试 MediatR 控制器和处理程序的建议
- rabbitmq - 使用 Spring Cloud Stream 和 RabbitMQ 设置消息属性
- highcharts - 如何在 React 应用中导入或加载哑铃图
- c++ - 有没有办法将对象动态更改为另一种类型?
- reactjs - 如何使用 Typescript 为 React Native Expo dev 做 AuthContext、createDataContext?
- tabulator - 找出用户何时编辑了行
- python - 如何对视图 Qweb 中的字段求和?奥多 14
- python - 如何字段仅计算不为空的值?