apache-kafka - 如何在融合控制中心配置数据生成连接器
问题描述
我想知道我可以在融合中心使用数据生成连接器的过程,以便我可以为测试主题生成随机数据。
我尝试使用一些设置连接 datagen 连接器,但它总是失败。
更新:我尝试连接在主题中创建的自己的模式,但它没有拾取它并且数据生成连接器无法启动。
这是 datagen 连接的配置:
{
"value.converter.schema.registry.url": "http://localhost:8081",
"value.converter.schemas.enable": "false",
"name": "datagen-protobuf-userprofile",
"connector.class": "io.confluent.kafka.connect.datagen.DatagenConnector",
"tasks.max": "1",
"key.converter": "org.apache.kafka.connect.storage.StringConverter",
"value.converter": "io.confluent.connect.protobuf.ProtobufConverter",
"transforms": [
"SetSchemaMetadata"
],
"transforms.SetSchemaMetadata.type": "org.apache.kafka.connect.transforms.SetSchemaMetadata$Value",
"transforms.SetSchemaMetadata.schema.name": "value_User_PROFILE",
"kafka.topic": "User_PROFILE",
"max.interval": "1000",
"iterations": "10000000",
"schema.filename": "value_User_PROFILE",
"schema.keyfield": "userid",
"quickstart": "value_User_PROFILE"
}
新主题中定义的架构:
{
"doc": "Sample schema to help you get started.",
"fields": [
{
"doc": "The int type is a 32-bit signed integer.",
"name": "userid",
"type": "int"
},
{
"doc": "The string is a unicode character sequence.",
"name": "firstname",
"type": "string"
},
{
"doc": "The string is a unicode character sequence.",
"name": "lastname",
"type": "string"
},
{
"doc": "The string is a unicode character sequence.",
"name": "countrycode",
"type": "string"
},
{
"doc": "this si double which store floting value as well",
"name": "rating",
"type": "double"
}
],
"name": "value_User_PROFILE",
"namespace": "com.mycorp.mynamespace",
"type": "record"
}
解决方案
您可以尝试以下步骤:
- 将 datagen 连接器目录放在配置的插件路径中——如果是分布式工作人员,您需要为所有工作人员执行此操作
- 重新启动所有工作人员
- 连接器应出现在控制中心的连接器列表页面上(点击
connect-ip:8083/connector-plugins
以确认连接器是否正确加载) - 填写连接器属性 - 您可以参考以下 repo 获取示例配置值:https ://github.com/confluentinc/kafka-connect-datagen/tree/master/config (您也可以在控件上上传属性文件中央)
- 测试并继续,稍后启动连接器
推荐阅读
- asp.net-mvc - ASP.Net MVC - 运行后台进程/异步而不在前台等待
- windows - 查找 Rscript 批处理的绝对路径
- java - Java泛型通配符用于不同子类型的说明
- reactjs - ESlint、React、Typescript 在明确使用时提供 no-unused-vars
- r - 绘制两个不连续范围的所有排列
- tensorflow - TensorFlow Keras(v2.2) 模型适合多个输出和损失失败
- python - 在 Pycharm 中私下处理 pypi 发布包的最佳方式是什么?
- mongodb - MongoDB 按顺序处理更改流
- python - 为另一个列表中列表的每个元素的存在生成掩码数组
- cloud-foundry - cf 登录凭据被拒绝,请重试