azure - Azure 搜索 - 亮点 - 在图像中定位
问题描述
只是在此处寻找指导甚至是有关方法的一般概述。
我正在使用 azure search 对一批 pdf 进行 OCR。我已经打开了点击突出显示,并且我成功地获得了结果,我正在为最终用户循环/显示在我的视图中。我正在考虑扩展该功能以显示pdf 图像,并在图像本身上突出显示,就像在 JFK azure 示例中一样。我不精通反应,似乎在那里迷路了。
我假设我需要使用创建的 normalized_images 将 OCR 图像保存到数据存储中以供参考?我在本地确实有可以加载的 pdf,但假设 OCR 图像可能不同。已打开 GeneratedNormalizedImagesPerPage 并打开在我的存储帐户中创建文件的缓存。
然后我假设我需要拉相关联的图像,显示它,使用突出显示结果并拉出检测到短语的相应边界框?这种方法的问题是,我看不到高光命中与命中位置(边界框)之间的任何关联,也看不到命中所在的关联图像文件。
可能在此处接近方法,但任何指导表示赞赏。
编辑 1 我确实注意到 JFK 示例中此页面上的项目: https ://github.com/microsoft/AzureSearch_JFK_Files/tree/master/JfkWebApiSkills/JfkWebApiSkills 将尝试复制 ImageStore(因此这些存储在我的存储帐户中)然后将 HocrGenerator (似乎处理文档中的点)放入我的技能集以作为我的索引的方法?
解决方案
这里有几个步骤:
您需要将 OCR 技能中的layoutText保存在 UI 可以访问的位置。JFK Files 演示将其转换为 HOCR(以显示在 UI 中)并将其作为索引中的字段保存在索引中,以便在搜索结果中检索它。HOCR 不是必需的,您可能会发现使用知识存储对象投影将布局存储在 blob 中更有效。
使用文件投影到知识存储中将提取的图像保存到 blob 存储中。请记住,图像可能会在此过程中调整大小,并且坐标将与保存到商店的调整大小的图像相匹配。如果要将坐标映射到原始图像,请参见this。
在搜索时,将突出显示映射到元数据。您将在 nodejs 前端找到此代码,但在原始演示中遵循此处的代码可能更简单。本质上,您只需在元数据中找到突出显示的单词的第一次出现,显示相关图像,并计算单词的边界区域。
推荐阅读
- mysql - 在报告中选择并添加按月和年分隔的记录
- python-3.x - PyGitHub:理解速率限制和管理请求数量
- amazon-dynamodb - 扫描嵌套对象数组 - DynamoDB
- python - 根据引用其他 2 列计算数据框列的中位数
- amazon-web-services - 如何使 AWS EC2 实例只能通过私有 IP 地址访问?
- php - Composer - 在新包中设置自动加载
- swiftui - 显示来自按钮的插页式广告,该按钮还可以从工作表切换另一个视图
- python - 在多列数据框熊猫中连续计算元素
- php - 迁移后Cakephp内存限制错误,Controller排查
- ruby-on-rails - Github actions rails commands "/bin/ruby: invalid option -: (-h will show valid options) (RuntimeError)"