首页 > 解决方案 > 为什么需要重做自动映射?(SQL炼金术)

问题描述

我正在尝试理解代码,它大致执行以下操作:

# db.py module

engine = create_engine(DB_URL, pool_timeout=20, pool_recycle=1)

def get_session():
    return scoped_session(sessionmaker(bind=engine, expire_on_commit=False))()

def get_base():
    base = automap_base()
    base.prepare(engine, reflect=True)
    return base

base = get_base()
User = base.classes.user

在某些功能中:

# other.py module
from db import get_base, get_session, User

def some_func():
   sess = get_session()
   # do something with sess and User:
   user = sess.query(User).first()

   User2 = get_base().classes.user
   try:
      check = sess.query(User2).first()
   except:
      sess.rollback()

   # do more with sess
   sess.commit()

some_func可以在例如 celery 任务中调用,但没有使用 greenlets 或其他类似的猴子补丁并发技巧。

我想知道,通过重新映射元数据可以实现什么?我的理解是否正确,那么由于范围会话 SQLAlchemy 无论如何都会有相同的对象?在这种情况下,甚至会话似乎都是一样的。

重点是什么?

我关于获得相同对象的假设是错误的:

(Pdb) pp user
<sqlalchemy.ext.automap.user object at 0x7f62e1a57390>
(Pdb) pp check
<sqlalchemy.ext.automap.user object at 0x7f62e0e93750>
(Pdb) pp user == check
False
(Pdb) pp user.id
1L
(Pdb) pp check.id
1L

id是主键,即唯一)

因此,SQLAlchemy 似乎将来自不同基础的对象分开保存。

到目前为止,我最好的猜测是,这个技巧允许在当前运行的事务之外进行用户存在测试。

标签: pythonsqlalchemyintrospection

解决方案


大多数时候它是不必要的,只会减慢应用程序的速度。数据库模式在应用程序运行时通常不会经常更改,简单的更改应该无关紧要(请参阅“数据独立性”)。重做反射等只是人们似乎在做的事情——可能是因为害怕使用全局变量。另一方面,在您的示例中,首先似乎db.py只进行一次反射以生成全局baseUser类。

这同样适用于范围会话注册表。注册表本身旨在为线程本地会话提供服务,因此一直重新创建它是没有意义的。相反,它应该是一个应用程序范围的单例。应该注意的是,使用范围会话意味着您的应用程序以与其兼容的方式使用线程,或者换句话说,单个线程应该处理单个作业,例如请求/响应等,以便session 自然绑定到线程的生命周期。

由于基类和模型类的重新创建,您关于获得相同对象的假设中断。尽管它们代表数据库中的同一行,但它们是不同的模型,因此在会话中产生不同的对象。


推荐阅读