hadoop - 文件未使用 Streamsets 从本地加载到 HDFS(已成功验证!)
问题描述
我刚刚开始使用流集,并且正在尝试将文本文件从本地加载到 HDFS。请注意:我使用的是 Cloudera Manager,这是“core-site.xml”的视图:
<property>
<name>hadoop.ssl.server.conf</name>
<value>ssl-server.xml</value>
<final>true</final>
</property>
<property>
<name>hadoop.ssl.client.conf</name>
<value>ssl-client.xml</value>
<final>true</final>
</property>
<property>
<name>hadoop.proxyuser.sdc.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.sdc.groups</name>
<value>*</value>
</property>
</configuration>
本地文件是存储在“/home/cloudera/Desktop”中的文本文件。
这是 Streamsets 中源(本地)配置的视图:
这是 Streamsets 中 Hadoop fs 配置的视图:
验证成功!
播放完管道后,我应该在我指定的 HDFS 目录中找到该文件,尤其是在“/user/cloudera”。
但是当我运行它时,文件还没有加载。
我确定我错过了一些东西,我找不到答案。能否请你帮忙!
谢谢,
解决方案
您需要播放管道,而不仅仅是验证它。
推荐阅读
- java - 使用 java 8 发送 curl 命令
- node-red - 模板节点 http out 返回“无响应对象”
- c++ - 智能指针:不存在合适的构造函数来从 derived_object* 转换为 std::shared_ptr
- java - 如何在循环中从 EditText 中提取文本并将其连接起来以在单个 TextView 中查看?
- javascript - 尽管范围是十六进制值,但 D3 scaleLinear() 返回 rgb 值
- strapi - 自动定时动作
- python - 联合子查询的 SqlAlchemy groupby
- haskell - 函数中的数据类型不匹配
- swift - 如何为结构实现哈希(进入哈希:输入哈希)
- python - 如何将 CoreML 模型转换为 TensorFlow 模型?