java - Flink 1.9 No Filesystem for scheme:kubernetes 上的 hdfs
问题描述
我正在尝试将我的项目从 Flink 1.4 升级到 Flink 1.9。在 1.4 上,我正在构建一个 fat jar,其中包含我所有的 hadoop2.9.2
依赖项,然后我将其提交到 k8s 上的 Flink 集群。我没有在集群上设置 hadoop。
当我将项目升级到 1.9 并升级集群时,我无法在集群上运行代码,尽管它在我的 IntelliJ IDE 上运行得很好。例外是:
java.io.IOException: No FileSystem for scheme: hdfs
at org.apache.hadoop.fs.FileSystem.getFileSystemClass(FileSystem.java:2660)
at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:2667)
at org.apache.hadoop.fs.FileSystem.access$200(FileSystem.java:94)
at org.apache.hadoop.fs.FileSystem$Cache.getInternal(FileSystem.java:2703)
at org.apache.hadoop.fs.FileSystem$Cache.get(FileSystem.java:2685)
at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:373)
at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:172)
...
由于我没有在 flink 中包含任何 hadoop 依赖项,因此我假设它应该仍然可以工作,因为所有依赖项都打包到 fat jar 中,因为它在 1.4 上工作得很好。
我尝试将依赖添加到 shaded-hadoop2 这并不能解决问题
compile group: 'org.apache.flink', name: 'flink-shaded-hadoop2-uber', version: '2.4.1-1.8.2'
我猜想为 flink 设置 hadoop 路径可能会修复它,并且一直在努力理解我应该如何在我的 Dockerfile 中做到这一点。我是否需要解压缩 hadoop 2 二进制文件或创建一些 jar 并将它们添加到/flink/lib
?
我的 Dockerfile 目前看起来像这样:
FROM openjdk:8-jre
MAINTAINER User "myemail@gmail.com"
LABEL version="v1.9.0"
ENV FLINK_HOME=/flink
ENV FLINK_CONF_DIR=/flink/conf
ENV FLINK_APPS_DIR=/flink/apps
ENV FLINK_LIB_DIR=/flink/lib
RUN mkdir -p ${FLINK_HOME}
RUN mkdir -p ${FLINK_CONF_DIR}
RUN mkdir -p ${FLINK_APPS_DIR}
RUN mkdir -p ${FLINK_LIB_DIR}
ENV PATH=$FLINK_HOME/bin:$PATH
ENV CLASSPATH=.:$FLINK_APPS_DIR:$FLINK_LIB_DIR
COPY dist/flink-1.9.0-bin-scala_2.11.tgz ${FLINK_HOME}/flink.tgz
WORKDIR ${FLINK_HOME}
COPY prepare-deployment.sh /
RUN chmod +x /prepare-deployment.sh
RUN /prepare-deployment.sh
RUN rm -rf /prepare-deployment.sh
COPY Tools/netstat /bin/netstat
COPY Tools/ttyd-static-amd64 /bin/ttyd
COPY Tools/jq /bin/jq
COPY Tools/checktm /bin/checktm
COPY Tools/checktm_log /bin/checktm_log
COPY docker-entrypoint.sh /
RUN chmod +x /docker-entrypoint.sh
RUN chmod -R 755 /bin
RUN chmod -R 777 /flink
RUN chmod -R 777 /etc
EXPOSE 6122 6123 6124 6125 6126 6127 8080 8081
ENTRYPOINT ["/docker-entrypoint.sh"]
CMD ["--help"]
解决方案
在 Flink 源代码中,您将找到一个flink-container目录,其中包含一个build.sh
用于构建 Docker 映像的脚本,以及一个Dockerfile
等。它们的设置旨在帮助您正确获取这些详细信息,并根据您的需要进行参数化以包含 hadoop 库。
推荐阅读
- postgresql - Gridsome 构建在 graphql 查询上失败
- laravel - 使用急切加载 laravel 返回用户模型
- php - 如何在 WooCommerce 中为正常价格和促销价格添加后缀?
- talend - 如何从 Talend 中的 txt 文件中提取模式
- streamreader - 如果数据以 '\r' 结尾,StreamReader.ReadLineAsync() 将无限期等待
- java - Java - Hibernate 环境在 Jar 中不起作用
- entity-framework-core - MVC,.NET 5.0 - 如何根据数据库值过滤索引/创建页面?
- php - PHP/Laravel 基于日期的 ID - 如何使其防水?
- python - 在 Tensorflow 中连接空数组
- angular - 无法将动态 *ngSwitchCase 值与 [class.active] 绑定