java - 为什么分析()方法没有获取图像?
问题描述
摘要/TL;DR:ML 对象检测应用程序无法检测对象,因为图像不是通过analyze()
方法获取的。
背景
我目前正在使用用 Java 编写的 CameraX 和 Google ML Kit 开发一个移动应用程序。该应用程序的目的是通过实时相机预览检测对象。我使用本指南实现了 ML Kit,该指南恰当地命名为“Detect and track objects with ML Kit on Android”(基本模型选项),以检测应用程序内连续帧中的对象。
但是,在运行该应用程序时,它会在我的设备上启动,并且相机预览继续工作,但该应用程序并没有实现其实际检测对象并将其显示在我的屏幕上的预期效果。为了尝试解决这个问题,我找到了这个 StackOverflow 答案这非常类似于这个问题。令我沮丧的是,用户使用自定义模型 (tflite) 构建了他们的应用程序。这与我的不同,因为我使用的是基本模型。根据我的研究,这使用了 ML Kit 的设备上对象检测。所应用的代码仅限于上述文档中的内容。由于我的 IDE (Android Studio) 没有在语法中显示任何错误,我不确定为什么我的应用程序上似乎没有任何对象检测。下面显示的是已使用的必要代码:
代码
public class MainActivity extends AppCompatActivity {
private ListenableFuture<ProcessCameraProvider> cameraProviderFuture;
private class YourAnalyzer implements ImageAnalysis.Analyzer {
@Override
@ExperimentalGetImage
public void analyze(ImageProxy imageProxy) {
Image mediaImage = imageProxy.getImage();
if (mediaImage != null) {
InputImage image =
InputImage.fromMediaImage(mediaImage, imageProxy.getImageInfo().getRotationDegrees());
//Pass image to an ML Kit Vision API
//...
ObjectDetectorOptions options =
new ObjectDetectorOptions.Builder()
.setDetectorMode(ObjectDetectorOptions.STREAM_MODE)
.enableClassification() // Optional
.build();
ObjectDetector objectDetector = ObjectDetection.getClient(options);
objectDetector.process(image)
.addOnSuccessListener(
new OnSuccessListener<List<DetectedObject>>() {
@Override
public void onSuccess(List<DetectedObject> detectedObjects) {
Log.d("TAG", "onSuccess" + detectedObjects.size());
for (DetectedObject detectedObject : detectedObjects) {
Rect boundingBox = detectedObject.getBoundingBox();
Integer trackingId = detectedObject.getTrackingId();
for (DetectedObject.Label label : detectedObject.getLabels()) {
String text = label.getText();
if (PredefinedCategory.FOOD.equals(text)) { }
int index = label.getIndex();
if (PredefinedCategory.FOOD_INDEX == index) { }
float confidence = label.getConfidence();
}
}
imageProxy.close();
}
}
)
.addOnFailureListener(
new OnFailureListener() {
@Override
public void onFailure(@NonNull Exception e) {
Log.d("TAG", "onFailure" + e);
imageProxy.close();
}
}
);
}
}
}
@Override
protected void onCreate(@Nullable Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
cameraProviderFuture = ProcessCameraProvider.getInstance(this);
PreviewView previewView = findViewById(R.id.previewView);
cameraProviderFuture.addListener(() -> {
try {
ProcessCameraProvider cameraProvider = cameraProviderFuture.get();
bindPreview(cameraProvider);
} catch (ExecutionException | InterruptedException e) {}
}, ContextCompat.getMainExecutor(this));
}
void bindPreview(@NonNull ProcessCameraProvider cameraProvider) {
PreviewView previewView = findViewById(R.id.previewView);
Preview preview = new Preview.Builder()
.build();
CameraSelector cameraSelector = new CameraSelector.Builder()
.requireLensFacing(CameraSelector.LENS_FACING_BACK)
.build();
preview.setSurfaceProvider(previewView.getSurfaceProvider());
ImageAnalysis imageAnalysis =
new ImageAnalysis.Builder()
.setTargetResolution(new Size(1280,720))
.setBackpressureStrategy(ImageAnalysis.STRATEGY_KEEP_ONLY_LATEST)
.build();
imageAnalysis.setAnalyzer(ContextCompat.getMainExecutor(this), new YourAnalyzer());
Camera camera = cameraProvider.bindToLifecycle((LifecycleOwner)this, cameraSelector, preview, imageAnalysis);
}
}
最终目标
如果需要任何类型的视觉示例来理解预期的效果应该产生什么,这里它包含在下图中。
更新 [2021 年 4 月 11 日]:在我尝试Log.d(..)
通过该OnSuccess
方法进行调试以确定返回对象列表大小后,AS 控制台在 D/TAG: onSuccess0
运行应用程序的几秒钟内打印了多达 30 次。这是否意味着应用程序没有检测到任何对象?自从我完全遵循文档以来,这一直困扰着我。
更新 [2021 年 5 月 1 日]:该行已从方法DetectedObject[] results = new DetectedObject[0];
中删除。onSuccess
for (DetectedObject detectedObject : results)
现在使用“detectedObjects”而不是“results”来反映文档中存在的代码。然而,onSuccess
is still logging D/TAG: onSuccess0
,这进一步增加了为什么该方法没有获取任何数据的问题。
解决方案
根据@Steven 提供的 Google ML Kit 示例应用程序的最小化版本,我能够通过实现 lambda 表达式并像这样最小化代码来解决这个问题;
objectDetector.process(image)
.addOnSuccessListener(detectedObjects -> {
Log.d("TAG", "onSuccess" + detectedObjects.size());
})
.addOnFailureListener(e -> Log.e("TAG", e.getLocalizedMessage()))
.addOnCompleteListener(result -> imageProxy.close());
进行此更改后运行程序后,应用程序成功启动,并且我的 logcat 打印出来,D/TAG: onSuccess1
表明确实检测到了一个对象!
但是,我确实想补充一点,编写代码时如此细微的差异让我想知道究竟是什么差异造成的。如果有人能弄清楚为什么这段代码有效,而不是我在 OP 中发布的内容,我将非常感谢您的解释。
推荐阅读
- maven - Azure DevOps Pipeline - Maven 仅在不存在时部署发布
- locust - 控制locust进程的退出代码
- php - 为什么要创建多个 PHP 会话?
- android - 布局中的Android绘图分隔线
- html - Chrome 上的本地 HTML 文件安全性
- c - 获取 OpenCL 设备 ID 时,clGetDeviceIDs() 函数会导致堆内存损坏
- php - 在“?”附近使用正确的语法 订购方式
- sql - 使用 LDAP 和 SQL 连接到 Teradata DB
- java - Scala - 如何将通用列表转换为数组并避免“没有可用于 T 的 ClassTag”
- django - 每次更新 django 中的帖子都会收到 403 Forbidden