首页 > 解决方案 > Openwayback 搜索不适用于 URL 中的阿拉伯网站

问题描述

我已经安装并设置了openwayback 的基础知识,现在尝试使其与以下资源一起使用

https://moj.gov.ae/documents/21128/102233/قرار+مجلس+الوزراء+رقم+18+لسنة+2017+بشأن+اعتماد+قائمة+الاشخاص+والتنظيمات+الارهابية.pdf

设置:

  1. 我用webrecorder.io下载了上面的warc文件。
  2. 将openwayback配置为最低限度并将warc文件放入数据文件夹
  3. 打开网络应用程序尝试搜索该确切地址

结果:

  1. 什么都找不到。地址变成

    http://localhost:8855/wayback/19960101000000-20181231235959 */ https://moj.gov.ae/documents/21128/102233/????+????+???????+? ??+18+??????+2017+??????+??????+??????+???????+??????????+? ????????.pdf

  2. 但例如,如果我只输入https://moj.gov.ae,那么我可以找到URL encoded. 但即使我将整个 URL 编码复制到搜索栏中,也没有任何结果。

我的期望:

  1. 如果您复制整个 URL,无论是否是阿拉伯语,该特定文档必须显示
  2. 搜索结果应该是非编码形式

有没有我错过的设置?

标签: arabicwebarchivewarc

解决方案


推荐阅读