python - 在 docker 中使用 django 运行 tika python
问题描述
我有一个 django 站点,它使用 tika-python 解析 pdf 并将解析的 pdf 内容存储在 elasticsearch 索引中。它在我的本地机器上运行良好。我想使用 docker 运行这个设置。但是,tika-python 不起作用,因为它需要 java 8 才能在后台运行 REST 服务器。
我的码头文件:
FROM python:3.6.5
WORKDIR /site
COPY requirements.txt ./
RUN pip install -r requirements.txt
COPY . .
EXPOSE 8000
EXPOSE 9200
ENV PATH="/site/poppler/bin:${PATH}"
CMD ["python", "manage.py", "runserver", "0.0.0.0:8000"]
requirements.txt 文件:
django==2.2
beautifulsoup4==4.6.0
json5==0.8.4
jsonschema==2.6.0
django-elasticsearch-dsl==0.5.1
tika==1.19
sklearn
在哪里(dockerfile 或要求)以及我应该如何添加 tika 所需的 java 8 以使其在 docker 中工作。在线教程/示例在容器中包含java+tika,很容易实现。不幸的是,在 stackoverflow 中也找不到类似的解决方案。
解决方案
推荐阅读
- r - 在 R 中创建自己的自定义预训练神经网络,然后对新数据进行微调
- html - 如何创建一个循环,使用 Jekyll 将所有类别呈现到列表中
- javascript - 如何比较 ES6 Class 方法?
- python - Python - 沃尔玛的网页抓取
- c# - 如何使用 SQL 命令从我的 DataTable 对象中使用 foreach-loop 更新 C# 中的 MS Access 数据库?
- java - 为什么maven的pom.xml中插件本身没有声明flyway的数据库驱动依赖?
- python - 为高分辨率和自定义缩放自定义 matlab 图
- php - MySqli-PHP 代码无法正确执行
- db2 - DB2 动态搜索
- c - CUDA 和 C 中的双三次插值 / 双三次插值如何应用于整个图像?