ssis - 卡夫卡与流集
问题描述
我正在阅读与 Kafka 和 StreamSets 相关的文章,我的理解是
Kafka 充当生产者系统和订阅者之间的代理。生产者将数据推送到 Kafka 集群,订阅者从 Kafka 拉取数据
StreamsSets 是一种通过管道将数据从一个源移动到另一个源的技术
现在,以下是我的问题,请帮助澄清
Kafka 和 StreamSets 的根本区别是什么?是 Kafka 不移动数据,但 StreamSets 移动数据吗?
如果卡夫卡不移动数据,卡夫卡是用来做什么的?如果它像 ETL 解决方案一样移动数据,它与 SSIS、Informatica 等有何不同?
StreamSets 与 SSIS、Informatica 等有何不同?
解决方案
StreamSets 是一个图形工具,包含允许数据移动的组件,其中恰好包括 Kafka 生产者和消费者,但您不需要使用它们。
它们是互补的,通过使用 Kafka,您可以允许流式系统中的背压或让非 StreamSets 生产者/消费者与其他 Kafka 主题进行交互。不,Kafka 不会移动数据(内部复制除外),与代理交互的客户端会移动。
我没有使用过 Informatica 或 SSIS,但我敢肯定,如果您联系了 StreamSets 的某个人,他们可以回答他们的比较方式
推荐阅读
- google-apps-script - Google Apps 脚本:OAuth2 异常:提供的属性值无效:标头:toType
- linux - awk 或 sed 删除每行文件中出现 x 后的所有文本
- mysql - 未签名的 MySQL CAST 不起作用
- excel - 计算与单个列中的多个条件匹配的列中的唯一值
- scala - 无法在 Play for Scala 中发送到浏览器 ByteArrayOutputStream
- php - mcrypt_encrypt():此算法不支持大小为 8 的密钥。第 57 行仅支持大小为 16、24 或 32 的键
- android - android类的安全性
- erlang - 在 erlang eunit failure 中打印测试夹具描述
- actions-on-google - webhook 响应中的异常处理 - DialogFlow
- android - 如果 kikid 在 firebase 数据库中不包含用户 ID,该怎么办?