python - 为什么需要重做自动映射?(SQL炼金术)
问题描述
我正在尝试理解代码,它大致执行以下操作:
# db.py module
engine = create_engine(DB_URL, pool_timeout=20, pool_recycle=1)
def get_session():
return scoped_session(sessionmaker(bind=engine, expire_on_commit=False))()
def get_base():
base = automap_base()
base.prepare(engine, reflect=True)
return base
base = get_base()
User = base.classes.user
在某些功能中:
# other.py module
from db import get_base, get_session, User
def some_func():
sess = get_session()
# do something with sess and User:
user = sess.query(User).first()
User2 = get_base().classes.user
try:
check = sess.query(User2).first()
except:
sess.rollback()
# do more with sess
sess.commit()
some_func
可以在例如 celery 任务中调用,但没有使用 greenlets 或其他类似的猴子补丁并发技巧。
我想知道,通过重新映射元数据可以实现什么?我的理解是否正确,那么由于范围会话 SQLAlchemy 无论如何都会有相同的对象?在这种情况下,甚至会话似乎都是一样的。
重点是什么?
我关于获得相同对象的假设是错误的:
(Pdb) pp user
<sqlalchemy.ext.automap.user object at 0x7f62e1a57390>
(Pdb) pp check
<sqlalchemy.ext.automap.user object at 0x7f62e0e93750>
(Pdb) pp user == check
False
(Pdb) pp user.id
1L
(Pdb) pp check.id
1L
(id
是主键,即唯一)
因此,SQLAlchemy 似乎将来自不同基础的对象分开保存。
到目前为止,我最好的猜测是,这个技巧允许在当前运行的事务之外进行用户存在测试。
解决方案
大多数时候它是不必要的,只会减慢应用程序的速度。数据库模式在应用程序运行时通常不会经常更改,简单的更改应该无关紧要(请参阅“数据独立性”)。重做反射等只是人们似乎在做的事情——可能是因为害怕使用全局变量。另一方面,在您的示例中,首先似乎db.py
只进行一次反射以生成全局base
和User
类。
这同样适用于范围会话注册表。注册表本身旨在为线程本地会话提供服务,因此一直重新创建它是没有意义的。相反,它应该是一个应用程序范围的单例。应该注意的是,使用范围会话意味着您的应用程序以与其兼容的方式使用线程,或者换句话说,单个线程应该处理单个作业,例如请求/响应等,以便session 自然绑定到线程的生命周期。
由于基类和模型类的重新创建,您关于获得相同对象的假设中断。尽管它们代表数据库中的同一行,但它们是不同的模型,因此在会话中产生不同的对象。
推荐阅读
- javascript - 如何将 React Router Link 组件的重定向延迟 1 秒?
- javascript - 使用嵌套数组访问复杂的 Json 文件
- java - 如何在不使用pair的情况下以一种方法返回两个对象?
- vba - 一个目标怎么可能是当前用户的文档文件夹?
- java - 在任何项目中正确实现服务层和 DTO 概念
- apache-kafka - Zookeeper/Kafka 如何为消费者保留偏移量?
- php - cron job cer.,pem 的问题
- ios - 是否可以在 iphone 上获取有关其他应用程序的信息
- python - Flask jinja 变量破坏 css
- c++ - 静态矢量不保存数据?