首页 > 解决方案 > 为什么当我将数据集多次加载到同一个变量中时,Jupyter Notebook 会消耗越来越多的数据?

问题描述

我只是在 jupyter-lab 中加载一个 CSV 数据,如下所示:

data = pd.read_csv('data_simple.csv')

该文件约为 300 MB。所以当我加载它时,内存使用量会显着增加;假设 500 MB。没关系。

但是当我再次运行完全相同的单元格时,内存使用量与第一次一样多。当我运行同一个单元时,它会继续运行。

为什么会发生这种情况?我将它加载到同一个变量中:data. 它不应该只是释放旧数据并重新分配吗?如果只是将所有数据保存在内存中,旧数据会去哪里?我试图用谷歌搜索它,但除了这个之外找不到任何东西。谢谢。

标签: pythonjupyter

解决方案


推荐阅读