首页 > 解决方案 > 运行 apache tika 和视觉服务器时出错

问题描述

我正在尝试 apache tika 的功能,并在设置和运行 tika 和张量流识别服务器后出现以下错误。

我使用 docker 安装并按照文档中的这些说明进行操作

一个。使用 docker(推荐)

  1. git clone https://github.com/USCDataScience/tika-dockers.git && cd tika-dockers
  2. docker build -f InceptionRestDockerfile -t uscdatascience/inception-rest-tika 。
  3. docker run -p 8764:8764 -it uscdatascience/inception-rest-tika
  4. 完成后,通过访问 http://localhost:8764/inception/v4/classify/image?topn=2&min_confidence=0.03&url=https://upload.wikimedia.org/wikipedia/commons/f/f6 测试设置/Working_Dogs%2C_Handlers_Share_Special_Bond_DVIDS124942.jpg 在您的网络浏览器中。

并得到以下错误


Traceback (most recent call last):

File "/usr/bin/inceptionapi", line 237, in <module>

app = Classifier(__name__)

File "/usr/bin/inceptionapi", line 194, in __init__

self.names = create_readable_names_for_imagenet_labels()

File "/usr/bin/inceptionapi", line 138, in create_readable_names_for_imagenet_labels

assert num_synsets_in_ilsvrc == 1000

AssertionError

tika vision 视频也出现了同样的错误,但图像字幕 API 工作正常,有人可以帮我解决这个问题吗

标签: pythondockerapache-tika

解决方案


断言错误是因为它无法下载一些imagenet数据,因为 Tensorflow 项目移动了它们所在的位置,因此在运行时无法加载这些数据。InceptionVideoRestDockerfile 和 InceptionRestDockerfile 都会受到影响。

我创建了一个包含所需更改的Fork ,并在此处向南加州大学的团队提交了一个拉取请求。使用更新后的 URL 允许这些 Docker 镜像加载模型。这反过来又允许它们在 Apache Tika 中使用。


推荐阅读