python - 为什么当我将数据集多次加载到同一个变量中时,Jupyter Notebook 会消耗越来越多的数据?
问题描述
我只是在 jupyter-lab 中加载一个 CSV 数据,如下所示:
data = pd.read_csv('data_simple.csv')
该文件约为 300 MB。所以当我加载它时,内存使用量会显着增加;假设 500 MB。没关系。
但是当我再次运行完全相同的单元格时,内存使用量与第一次一样多。当我运行同一个单元时,它会继续运行。
为什么会发生这种情况?我将它加载到同一个变量中:data
. 它不应该只是释放旧数据并重新分配吗?如果只是将所有数据保存在内存中,旧数据会去哪里?我试图用谷歌搜索它,但除了这个之外找不到任何东西。谢谢。
解决方案
推荐阅读
- java - 灵感来自 GENERATED TALEND CLASS 并在 JAVA 中重用
- reactjs - 当用户从标题中单击 navigation.goback 时如何重置所有路由参数?
- javascript - React - 如何使 CSS 类更具选择性并覆盖默认类?
- c# - Mongo C# 驱动程序排序与自定义方法
- java - 错误 java.lang.NoClassDefFoundError: org/apache/poi/xssf/usermodel/XSSFWorkbookV
- sql - 遍历查询
- django - 如何将 Django 管理连接到 Firebase
- go - 使用文件系统的本机方式复制本地文件
- python - Pandas:检查一个日期列是否位于两个日期列之间,如果 true 填充输出
- r - R中的monstR包