首页 > 解决方案 > 在 Python 中开发用于预测出勤率的神经网络

问题描述

我对机器学习和神经网络很陌生。我关注了https://www.analyticsvidhya.com/blog/2017/05/neural-network-from-scratch-in-python-and-r/以了解我在看什么。

我的目标是根据温度、工作日/周末、下雨、风暴、假期、公司活动等来预测商店的出勤率。

我想我可以将其中的大多数分解为 0 或 1,例如 0 表示周末、没有下雨、没有风暴、没有假期、没有事件,而 1 表示工作日、下雨、风暴、事件、假期

对于温度,我尝试使用 T-T0/T1-T0 与该区域的最高和最低温度进行归一化

我遇到的一些问题是示例中给出的代码总是返回 0 或 1 之间的值,这让我认为我必须标准化输出(出勤率)。我尝试了与温度相同的方法,但预测最小值和最大值是困难的,即使使用 0 和像 5000(平均值约为 1100)这样荒谬的值,NN 也没有给出正确的值

我假设这与 Sigmoid 函数有关,我可能需要使用不同的激活函数,但我还是新手,很容易忽略其他东西

示例数据:

Temp: 104
Rain: 0
Holiday: 0
Weekday: 1
Attendance: 410

Temp: 106
Rain: 0
Holiday: 0
Weekday: 0
Attendance: 2338

Temp: 88
Rain: 1
Holiday: 0
Weekday: 1
Attendance: 361

我最近的代码(我回到原来的代码,因为我的编辑导致它的性能更差)

import numpy as np

#Input array
X=np.array([[.88,1,1,1],[.92,0,0,0],[.56,1,1,1]])

#Output
y=np.array([[410],[2338],[361]])

#Sigmoid Function
def sigmoid (x):
    return 1/(1 + np.exp(-x))

#Derivative of Sigmoid Function
def derivatives_sigmoid(x):
    return x * (1 - x)

#Variable initialization
epoch=25000 #Setting training iterations
lr=0.1 #Setting learning rate
inputlayer_neurons = X.shape[1] #number of features in data set
hiddenlayer_neurons = 3 #number of hidden layers neurons
output_neurons = 1 #number of neurons at output layer

#weight and bias initialization
wh=np.random.uniform(size=(inputlayer_neurons,hiddenlayer_neurons))
bh=np.random.uniform(size=(1,hiddenlayer_neurons))
wout=np.random.uniform(size=(hiddenlayer_neurons,output_neurons))
bout=np.random.uniform(size=(1,output_neurons))

for i in range(epoch):

    #Forward Propogation
    hidden_layer_input1=np.dot(X,wh)
    hidden_layer_input=hidden_layer_input1 + bh
    hiddenlayer_activations = sigmoid(hidden_layer_input)
    output_layer_input1=np.dot(hiddenlayer_activations,wout)
    output_layer_input= output_layer_input1+ bout
    output = sigmoid(output_layer_input)

    #Backpropagation
    E = y-output
    slope_output_layer = derivatives_sigmoid(output)
    slope_hidden_layer = derivatives_sigmoid(hiddenlayer_activations)
    d_output = E * slope_output_layer
    Error_at_hidden_layer = d_output.dot(wout.T)
    d_hiddenlayer = Error_at_hidden_layer * slope_hidden_layer
    wout += hiddenlayer_activations.T.dot(d_output) *lr
    bout += np.sum(d_output, axis=0,keepdims=True) *lr
    wh += X.T.dot(d_hiddenlayer) *lr
    bh += np.sum(d_hiddenlayer, axis=0,keepdims=True) *lr

print output

什么是预测这一点的好方法?我需要改革我的神经网络还是这个例子就足够了?

标签: pythonmachine-learningneural-networkprediction

解决方案


你的假设是对的。sigmoid 函数总是返回 0 和 1 之间的值。显然,这对您来说不是一个好的解决方案,因为您正在处理回归问题(而不是分类)。

只需完全放弃激活函数并使用线性函数即可。

  ...
  hiddenlayer_activations = hidden_layer_input
  ...

推荐阅读