首页 > 解决方案 > 如何使用 Ecto 加入多个存储库?

问题描述

我有两个数据库,主数据库(PostgreSQL)+统计数据库(ClickHouse)。统计数据库包含来自主数据库的数据的子部分,足以执行计算。:binary_id两个数据库中的所有 id 都是相似的 ( )。我需要找到一种方法,将从统计数据库中获得的结果与对主数据库的查询结合起来。就纯 SQL 解决方案而言,可能是这样的,VALUES从统计数据库获得的数据在哪里:

SELECT p0."id",
       p0."name",
       f1."average_count"
FROM "persons" AS p0
         JOIN (VALUES (0.0, '906af2c0-cde2-4996-9a98-bdbf986fe687'::uuid),
                      (0.2857142857142857, 'aba7c694-3453-4a55-aab9-4b542dbb4ba9'::uuid),
                      (0.2857142857142857, '2dab3350-6149-4752-a55e-7477a6ad0dd3'::uuid))
               as f1 (average_count, user_id)
              on f1.user_id = p0.id;

我的项目积极使用 Ecto,并且有很多即时构建的查询。这就是为什么我不能像上面发布的那样只执行纯 SQL 查询,并且应该有基于 Ecto 的解决方案。有没有办法与 Ecto 进行这样的连接?

标签: postgresqlelixirectoclickhouse

解决方案


它不漂亮,但你可以利用 Postgres' UNNEST

users = [
  %{id: "906af2c0-cde2-4996-9a98-bdbf986fe687", average_count: 0.0},
  %{id: "aba7c694-3453-4a55-aab9-4b542dbb4ba9", average_count: 0.2857142857142857},
  %{id: "2dab3350-6149-4752-a55e-7477a6ad0dd3", average_count: 0.2857142857142857}
]

{ids, average_counts} =
  users
  |> Stream.map(&{&1.id, &1.average_count})
  |> Enum.unzip()

dumped_ids =
  for id <- ids do
    {:ok, dumped} = Ecto.UUID.dump(id)
    dumped
  end

query =
  from p in Person,
    join: f in fragment("SELECT UNNEST(?::uuid[]) AS user_id, UNNEST(?::float[]) AS average_count", ^dumped_ids, ^average_counts),
    on: f.user_id == p.id,
    select: %{id: p.id, name: p.name, average_count: f.average_count}

Repo.all(query)

也许这不是最好的方法。我不是数据库专家。但这在IEx中对我有用。


推荐阅读