首页 > 解决方案 > Django ORM:误导`prefetch_related`的`first()`

问题描述

在 DRF 端点上工作时,我遇到了一个问题prefetch_relatedfirst调用了预取集。让我们考虑两个模型:XY; Y包含一个外键X

然后我执行以下代码:

qs = X.objects.all().prefetch_related("y_set")

for x in qs:
    for y in x.y_set.all():
        print(e)

一切正常,django 按预期执行了 2 次查询。

然后我执行:

for x in qs:
    for y in x.y_set.all():
        print(e)
    first = x.y_set.first()

在这个例子中,Django 执行 n+2 次不期望的查询(至少对我而言)。

我找到了一种解决方法:

for x in qs:
    for y in x.y_set.all():
        print(e)
    first = y_set.all()[0] if y_set.all() else None

但这对我来说并不令人满意 - 我觉得检查是否qs不为空然后取第一个元素有点乱,我肯定更喜欢使用first或其他隐藏此逻辑的函数。

谁能解释为什么first不使用预取缓存或者你能给我一个提示如何更清楚地处理它?(我不想添加包装器来处理它,我更喜欢原生 django orm 解决方案。我也不能只从循环中获取第一个元素 - 我简化了很多示例)

提前致谢!

标签: djangodjango-orm

解决方案


.first()基本上使用LIMITSQL 中的子句来获取查询的第一个对象。因此,当有人调用queryset.first()它时,它自然会进行单独的查询。

您进一步问,既然查询集已经存在于内存中,为什么.first()不简单地使用该评估查询集?好吧,让我这样说:

在查询集等上链接方法是很常见的.annotate(...).filter(...),我们可以执行以下操作:

queryset = SomeModel.objects.all()
for object in queryset:
    print(object)
queryset2 = list(queryset.filter(a=1))

在这里,我们希望queryset2对数据库进行不同的查询,而不是在 python 级别过滤对象,因为由于某种原因,数据库本身可能有新条目,或者我们甚至可能会做一些注释而不是简单地调用.filter(),所以我们想要这个成为一个单独的查询。这本质上与.first()不会简单地使用预取对象的原因相同。


推荐阅读