首页 > 解决方案 > 在 PDF blob 中搜索关键字 - Azure 搜索

问题描述

我正在尝试搜索 PDF 文档元数据中包含的关键字。我不确定这是否可能。任何指导将不胜感激!

这是我所指的 PDF 中的关键字/标签示例 在此处输入图像描述

我知道可以将字段添加到搜索索引,但不确定如何映射它。我尝试了以下方法,但没有奏效。

在此处输入图像描述

在此处输入图像描述

标签: azuremetadataazure-blob-storageazure-cognitive-search

解决方案


以下是关键字元数据的工作方式 -

  1. 将关键字(元数据)添加到 pdf 文件将不起作用,因为 pdf 仅支持选定的自定义元数据标签。请参阅本文档 - https://docs.microsoft.com/en-us/azure/search/search-howto-indexing-azure-blob-storage

  2. 解决此问题的方法是将元数据标记添加到 pdf 文件 blob 本身。 在此处输入图像描述

  3. 在我们为(“所有元数据”/存储元数据)的天蓝色搜索创建索引后,此键开始出现在要选择的字段名称列表下(搜索/检索/过滤等)。 在此处输入图像描述

  4. 最后我们现在可以搜索自定义关键字了。 在此处输入图像描述


推荐阅读