scala - HBase Spark - 与 Spark 2.0 的连接
问题描述
一直在尝试使用 Spark 和 Scala 将数据写入 HBase。要求是 - 我必须根据来自业务的列的时间戳设置 HBase 记录的 TTL。
我无法编译我的代码,详细信息如下。
- 为此,我正在使用 HBase Spark Alpha 4 连接器(hbase-spark-2.0.0-alpha4.jar)。
- 将列的时间戳值转换为 Epoch Timestamp 并尝试基于此设置 TTL。
- 当我尝试在 Spark Shell 中执行相同的代码时 - 它正在无缝执行并且我能够在 HBase 中看到预期的输出。
- 但是当我尝试在 Eclipse 中编译它时 - 它失败并出现以下错误。
[ERROR] error: missing or invalid dependency detected while loading class file 'HBaseContext.class'. [INFO] Could not access type Logging in package org.apache.spark, [INFO] because it (or its dependencies) are missing.
有人可以提供解决这个问题的意见吗?
解决方案
在我的情况下,我重新编译了连接器:https ://github.com/apache/hbase-connectors.git ,并使用基于我的项目的参数。就像:
mvn -Dspark.version=2.2.2 -Dscala.version=2.11.7 -Dscala.binary.version=2.11 clean install
没有错误。
提示:groupId 与 maven center repo 中的 groupId 不同
推荐阅读
- wordpress - 使用 parse_blocks 和 render_block 获取 wordpress 帖子图像的 srcset
- php - 如何在是/否收音机后显示表格的一部分?
- sql - 将 XML-Blob 转换为关系表
- npm - 在 Azure 管道中为内置的 windows-latest 映像缓存 NPM 依赖项
- javascript - 如何使用 Js 在 HTML BODY 中插入元素,然后使用 Js 选择相同的元素,然后将更多数据附加到其中?
- spring - 引起:org.xml.sax.SAXParseException:cvc-complex-type.2.4.c:找不到元素'jpa:repositories'的声明
- nswag - Nswag - 生成的客户端中不存在属性“过时”中的消息
- python - 从另一个文件导入时,Python Pygame 代码运行非常慢
- c++ - 在 [C++] 中键入 0 之前的 10 个数字的总和
- python - sklearn 已安装但无法导入