pandas - 避免使用 pandas 到 sqlalchemy 转换的重复项
问题描述
将一堆 CSV 上传到我的 Flask 应用程序时,我希望能够将它们批量输入到我的 sqlalchemy 表中。
status | medium | landing page
converted | google | www.example.com
...
Pandas 有一个 to_sql 方法,可以将 CSV 批量插入数据库,但是唯一的重复检查是查看该表是否已经存在于数据库中。我需要检查各个条目是否已经在数据库中,并且只上传新条目。
目前,我知道我可以通过遍历 pandas 数据框来解决这个问题,但是由于通常不建议遍历数据框,我想知道是否有更有效的方法来解决这个问题。有什么建议么?
解决方案
推荐阅读
- python - 这是什么意思'泛型类型的参数必须是类型'?
- python - 使用 pygame.mixer 播放某些音频文件时出错
- redis - 创建新密钥时的 Redis 密钥空间通知
- locust - 如何使用 pyinstaller 打包 locust 文件
- c# - .NET Core 3.1 发布请求连接在 5 分钟后关闭
- mysql - Node.js、discord.js 和 MySQL - ER_NO_SUCH_TABLE:表 'NAME' 不存在
- r - 使用字符串和同一 df 中的另一个变量构造变量名称,然后在 R 中更新其值
- json - 在 Swift 中从 JSON 加载数据后如何预处理数据?
- server - 启动 WildFly 服务器时出错(地址已在使用中)
- bbc-microbit - micro:bit 没有响应 AB 按钮按下