python - 内存错误的原因。Numpy除以标准差
问题描述
我正在尝试为 MNIST 数据集标准化我的训练和测试集。这是我的代码
import numpy as np
import pandas as pd
prediction = pd.read_csv("sample_submission.csv")
test_csv = pd.read_csv("test.csv")
train_csv = pd.read_csv("train.csv")
train = train_csv.values.T # turn train set data frame to numpy array
test = test_csv.values.T
y_values = train[[0], :] # bring y values [3,1,4,6,2,0,...]
train = train[1:, :]
y = np.zeros((10, y_values.shape[1]))
for i in range(y_values.shape[1]):
y[y_values[0][i]][i] = 1 # one-hot encoding
# scaling data set values to range (0,1)
train = np.divide(train, np.std(train))
test = np.divide(test, np.std(test))
一切似乎都在工作,只是它在我尝试将测试集与其标准偏差分开的最后一部分给了我记忆错误。
Traceback (most recent call last):
File "C:/Users/falco/PycharmProjects/Digit-Recognizer/main.py", line 26, in <module>
test = np.divide(test, np.std(test))
File "C:\Users\falco\Anaconda3\lib\site-packages\numpy\core\fromnumeric.py", line 3242, in std
**kwargs)
File "C:\Users\falco\Anaconda3\lib\site-packages\numpy\core\_methods.py", line 140, in _std
keepdims=keepdims)
File "C:\Users\falco\Anaconda3\lib\site-packages\numpy\core\_methods.py", line 117, in _var
x = asanyarray(arr - arrmean)
MemoryError
任何关于为什么会发生这种情况的帮助/想法将不胜感激!
解决方案
推荐阅读
- class - TYPO3 - 覆盖 Core\Routing\UrlGenerator
- r - 如何在由一台本地机器作为主机和几台远程 VPS 机器作为工作人员的集群上运行带有 Parallel 包的 R 代码?
- html - 是否可以使用 React 在函数中呈现 HTML?
- java - 表单建模器未在选择中显示枚举值
- sql - 在某些条件和 ROW_NUMBER 函数中使用合并
- javascript - 有没有一种简单的方法可以在 d3.csvParse 遇到空行时停止它?
- python-3.x - 不明白为什么服务器不会响应客户端(即使在打开防火墙后 | Python | 服务器
- sql - 选择行,对于 A 列中的相同值,B 列在所有行中都具有特定值
- c - 为什么在 C 中使用链表前端元素错误获取优先级队列?
- python-3.x - `on_typing` 事件在 self bot discord.py 上不起作用