首页 > 解决方案 > 带有 ReferenceField() 的 MongoEngine 条件过滤器

问题描述

假设有简单UserPost模型。

class User(Document):
    user_id = StringField(primary_key=True)
    gender = StringField(default='M')


class Post(Document):
    user = ReferenceField(User)
    body = StringField()


if __name__ == '__main__':
    hide = User(user_id='hide', gender='M').save()
    john = User(user_id='john', gender='M').save()
    test = User(user_id='test', gender='W').save()
    admin = User(user_id='admin', gender='W').save()

    Post(user=hide, body='hide post').save()
    Post(user=john, body='john post').save()
    Post(user=test, body='test post').save()
    Post(user=admin, body='admin post').save()

    hide = User.objects(user_id='hide').first()

    posts = Post.objects(user__ne=hide)
    for post in posts:
        print(post.body)

结果是

约翰发布测试帖子管理帖子

我触发了条件 user__ne=hide,所以除了 hide 的帖子之外,每个帖子都打印了。

在这种情况下,如何添加更多条件喜欢,gender='W'?

下面的代码是我试过的结果。

posts = Post.objects(user__ne=hide, user__gender__ne='M')

from mongoengine.queryset.visitor import Q

posts = Post.objects(Q(user__ne=hide) & Q(user__gender__ne='M'))

但是两个代码都抛出错误->mongoengine.errors.InvalidQueryError: Cannot perform join in mongoDB: user__gender

我知道它可以用这个来实现。

gender = User.objects(gender__ne='M')
posts = Post.objects(Q(user__ne=hide) & Q(user__nin=gender))

但是如果用户的行太多,可能会出现内存问题。

问题

  1. 是否可以一次查询条件?

  2. .objects() 是否实际查询数据库?

标签: mongodbmongoengine

解决方案


如兄弟github 票上所述

1 - mongodb 中没有连接,因此除了您建议的选项外,没有其他选择。为了提高性能和减少内存占用,您可以做的一件简单的事情是仅获取用户 ID,如下所示:

male_ids = User.objects(gender__ne='M').scalar('id')   # Only fetch the user ids, i.o loading full object data into User model
posts = Post.objects(Q(user__ne=hide) & Q(user__nin=male_ids))

注意:mongoengine 中有一个CachedReferenceField可以帮助您实现您想要的(它基本上会复制genderPost 集合中对用户的引用旁边的值)并保持同步,但 CachedReferenceField 存在一些错误(和性能问题以使它们保持同步)所以也许它可以解决简单的用例,但我不建议使用它。

2 -.objects()返回一个查询集,仅当您遍历查询集(或打印查询集)时才会触发查询。见下文:

user_qs = User.objects()
print(type(user_qs))    # <class mongoengine.queryset.queryset.QuerySet>, query not fired yet
for user in qs_user:    # fires the actual query and load data in User instances
        pass

推荐阅读