首页 > 解决方案 > 从参数化 SQL 调用填充新的数据框列

问题描述

我有一个数据框,其单列tbl_name包含我的 SQLite 数据库中的表列表:

tables = pd.read_sql_query("SELECT tbl_name FROM sqlite_master WHERE type = 'table'", db)

我想添加一列,其中包含数据库中每个表的行数。我希望这会起作用:

tables['count'] = tables.apply(lambda row : pd.read_sql_query(f"SELECT COUNT(*) FROM {row['tbl_name'}", db).iloc[0,0])

这会引发一个关键错误。这条线应该是什么样子?

更奇怪的是,为了诊断我尝试仅使用一张表中的行数的问题:

pd.read_sql_query(f'SELECT COUNT(*) FROM help_infotip', db).iloc[0,0]
>> 3

tables['count'] = tables.apply(lambda row : pd.read_sql_query(f'SELECT COUNT(*) FROM help_infotip', db).iloc[0,0])

导致一列只有 NaN 值,而不是 3s!

我显然遇到了一些根本性的错误,但我看不出是什么。

标签: pythonpandas

解决方案


试试这个:

tables['count'] = tables.tbl_name.apply(lambda row : pd.read_sql_query(f"SELECT COUNT(*) FROM {row}", db).iloc[0,0])

在您的版本中,axis=1缺少,应该如下所示:

tables['count'] = tables.apply(lambda row : pd.read_sql_query(f"SELECT COUNT(*) FROM {row['tbl_name']}", db).iloc[0,0], axis=1)

推荐阅读