首页 > 解决方案 > 有人可以解释一下这种热编码器方法是如何工作的吗?

问题描述

我已经在网上获得了这个代码,它可以对一组标签编码值进行热编码。我特别不明白最后一行。请帮忙

我最初认为每个 y 为 1 时,它都会将该索引的值替换为 1,但是,如何呢?

def read_dataset():
  df = pd.read_csv("sonar.all-data.csv")
  x = df[df.columns[0:60]].values
  y = df[df.columns[60]]
  encoder = LabelEncoder()
  encoder.fit(y)
  y = oneHotEncode(y)
  return(x, y)

def oneHotEncode(labels):
  n_labels = len(labels)
  n_unique_labels = len(np.unique(labels))
  oneHE = np.zeros((n_labels, n_unique_labels))
  oneHE[np.arange(n_labels), labels] = 1
  return oneHE

我希望了解这段代码的工作原理,但我不明白 np.arange 的那一行

标签: pythontensorflowmachine-learningartificial-intelligencedata-processing

解决方案


np.arange()类似于range()但创建一个 numpy 数组。因此,如果您有 10 个标签,它会返回一个包含从 0 到 9 的连续数字的数组。这用于选择oneHE数组的行(初始化后仅包含零)。labels用于选择列。

所以它只是在所有行中选择相应的列并将值设置为 1。


推荐阅读