apache-kafka - 在 ftp 上对文件进行流处理
问题描述
在其中一个应用程序中,我们的客户端接收到文件中的多个事件,这些事件上传到 ftp 服务器。这些文件的频率将以分钟为单位。这些事件需要单独处理。
处理这些事件的一种方法是将它们推送到 kafka,然后使用 kafka 流/消费者一一处理它们。这是正确的方法还是我们应该考虑一些像 spark 这样的批处理?在最坏的情况下,我们预计每分钟不会有超过 10K 的消息。
谢谢
解决方案
推荐阅读
- git - 导入主要包含 Git 文件夹的项目(如何打开)
- c# - XML反序列化如何遍历到第三个孩子
- maven - Maven 中的 project.basedir 问题,未提及 jar
- vb.net - OOP 新手 - 使用 List(of T) 或 Collection()
- java - Java正则表达式提取方括号或圆括号内的内容
- keras - 关于 keras , hyperas 中的自定义损失
- .net - 应用程序/项目名称是否有系统变量?
- javascript - Javascript Array - 我尝试了很多但没有正确得到答案
- powershell - 如何在字符串中声明一个变量
- python - 如何使用 Python 逻辑作为 ABAP 解释器?