google-cloud-platform - 异步批处理作业卡住了?
问题描述
我们使用 Async Batch Jobs 已经有一段时间了,可以处理 PDF 文件,而无需先将它们转换为图像。这工作得很好,直到昨晚。创建工作后,工作似乎永远不会完成。我们的工作被卡住了 11 个小时,在取消工作后,我尝试了其他一些 PDF 工作,但它们都被卡住了。
我们将文件上传到 GCP 存储,使用 Feature_DOCUMENT_TEXT_DETECTION 启动 AsyncBatchAnnotateFilesRequest,然后我们使用 operation.Wait() 以便它每 45 秒检查一次作业状态以检查它是否已经完成。我们使用 Go 库来做到这一点。
任何其他人看到此问题或知道可能导致此问题的原因?
解决方案
从昨晚开始,我就遇到了这种情况,猜测谷歌方面发生了一些变化。对我有用的是确保它输出到的目录/文件首先不存在。
Iterable<Blob> blobs = storage.list(outputBucketName,
BlobListOption.prefix(outputFolderName.replaceAll("^[^/]*/", ""))).iterateAll();
for (Blob blob : blobs) {
blob.delete(Blob.BlobSourceOption.generationMatch());
}
编辑:实际上也许它只是完全无关,谷歌没有提供细节,但说它现在不应该再被卡住了:
https://groups.google.com/forum/#!topic/cloud-vision-discuss/p0PbNQ2KMGg
推荐阅读
- css - 引导角度日期选择器 ngbDatepicker 不会在 ngbPanelContent 上溢出
- ionic-framework - HTML5 视频播放器在使用 Ionic-v3 加载位于设备内部的视频时出错
- javascript - 如何使用 Jquery 在一个列标题下包含 2 列
- julia - 如何从 Julia 图中提取 xy 数据?
- c# - 如何限制日期时间 UI 只选择今天或现在之后的日期?
- swift - 如何以编程方式定位 scene.scn 中的对象?
- r - 查找泛型函数的麻烦方法
- python-2.7 - 如何在for循环的每次迭代中获取字典中的所有产品
- sikuli - 应用程序打开在 sikuli 中打开多个窗口
- c# - 为什么不尽可能使用“in”作为方法参数?