首页 > 解决方案 > 在 Clickhouse 集群中获取重复项

问题描述

我已经开始在 clickhouse 上集群环境。

我从使用分布式表概念的基本的两个分片和一个副本配置开始。

当我在分布式表上执行查询时,我得到了重复的值。

即,如果我有 43 行,我得到的结果为 86。

任何人都可以请帮助如何解决这个重复问题..

请在下面找到我的 config.xml 文件设置。我在两个 Clickhouse 服务器中都使用了相同的设置

<http_port>8123</http_port>
    <tcp_port>9000</tcp_port>
<remote_servers>
    <perftest_3shards_1replicas>
        <shard>
            <replica>
                <host>192.168.0.132</host>
                <port>9000</port>
            </replica>
        </shard>
        <shard>
            <replica>
                <host>192.168.0.184</host>
                <port>9000</port>
            </replica>
        </shard>
        <shard>
    </perftest_3shards_1replicas>
</remote_servers>

标签: clickhouse

解决方案


据我了解,您只是将相同的数据放入每个分片,而不是在分片之间拆分数据。


推荐阅读