首页 > 解决方案 > 通过将其与传入记录进行比较来删除不断增长的数据库表中的重复记录 - Python

问题描述

我将每小时在 MySQL 表中存储几千条记录,但问题是如果传入的记录和表有重复的记录,要么从表中删除它们,要么从传入的数据中删除它们,然后存储传入的数据。我将使用 python 来完成这项任务。但是我应该如何处理不断增长的表格大小和内存问题。

我正在考虑使用带有块大小生成器的 pandas read_sql 来获取表块并将其与传入记录进行比较,然后从表中删除重复记录,最后将整个传入数据存储在表中。这对我有用吗?

标签: pythonmysql

解决方案


推荐阅读