python - 在 Python 中开发用于预测出勤率的神经网络
问题描述
我对机器学习和神经网络很陌生。我关注了https://www.analyticsvidhya.com/blog/2017/05/neural-network-from-scratch-in-python-and-r/以了解我在看什么。
我的目标是根据温度、工作日/周末、下雨、风暴、假期、公司活动等来预测商店的出勤率。
我想我可以将其中的大多数分解为 0 或 1,例如 0 表示周末、没有下雨、没有风暴、没有假期、没有事件,而 1 表示工作日、下雨、风暴、事件、假期
对于温度,我尝试使用 T-T0/T1-T0 与该区域的最高和最低温度进行归一化
我遇到的一些问题是示例中给出的代码总是返回 0 或 1 之间的值,这让我认为我必须标准化输出(出勤率)。我尝试了与温度相同的方法,但预测最小值和最大值是困难的,即使使用 0 和像 5000(平均值约为 1100)这样荒谬的值,NN 也没有给出正确的值
我假设这与 Sigmoid 函数有关,我可能需要使用不同的激活函数,但我还是新手,很容易忽略其他东西
示例数据:
Temp: 104
Rain: 0
Holiday: 0
Weekday: 1
Attendance: 410
Temp: 106
Rain: 0
Holiday: 0
Weekday: 0
Attendance: 2338
Temp: 88
Rain: 1
Holiday: 0
Weekday: 1
Attendance: 361
我最近的代码(我回到原来的代码,因为我的编辑导致它的性能更差)
import numpy as np
#Input array
X=np.array([[.88,1,1,1],[.92,0,0,0],[.56,1,1,1]])
#Output
y=np.array([[410],[2338],[361]])
#Sigmoid Function
def sigmoid (x):
return 1/(1 + np.exp(-x))
#Derivative of Sigmoid Function
def derivatives_sigmoid(x):
return x * (1 - x)
#Variable initialization
epoch=25000 #Setting training iterations
lr=0.1 #Setting learning rate
inputlayer_neurons = X.shape[1] #number of features in data set
hiddenlayer_neurons = 3 #number of hidden layers neurons
output_neurons = 1 #number of neurons at output layer
#weight and bias initialization
wh=np.random.uniform(size=(inputlayer_neurons,hiddenlayer_neurons))
bh=np.random.uniform(size=(1,hiddenlayer_neurons))
wout=np.random.uniform(size=(hiddenlayer_neurons,output_neurons))
bout=np.random.uniform(size=(1,output_neurons))
for i in range(epoch):
#Forward Propogation
hidden_layer_input1=np.dot(X,wh)
hidden_layer_input=hidden_layer_input1 + bh
hiddenlayer_activations = sigmoid(hidden_layer_input)
output_layer_input1=np.dot(hiddenlayer_activations,wout)
output_layer_input= output_layer_input1+ bout
output = sigmoid(output_layer_input)
#Backpropagation
E = y-output
slope_output_layer = derivatives_sigmoid(output)
slope_hidden_layer = derivatives_sigmoid(hiddenlayer_activations)
d_output = E * slope_output_layer
Error_at_hidden_layer = d_output.dot(wout.T)
d_hiddenlayer = Error_at_hidden_layer * slope_hidden_layer
wout += hiddenlayer_activations.T.dot(d_output) *lr
bout += np.sum(d_output, axis=0,keepdims=True) *lr
wh += X.T.dot(d_hiddenlayer) *lr
bh += np.sum(d_hiddenlayer, axis=0,keepdims=True) *lr
print output
什么是预测这一点的好方法?我需要改革我的神经网络还是这个例子就足够了?
解决方案
你的假设是对的。sigmoid 函数总是返回 0 和 1 之间的值。显然,这对您来说不是一个好的解决方案,因为您正在处理回归问题(而不是分类)。
只需完全放弃激活函数并使用线性函数即可。
...
hiddenlayer_activations = hidden_layer_input
...
推荐阅读
- elixir - 如何使用 elixir 自定义任务启动持久牛仔服务器
- javascript - 在 x 轴上显示每 n 个标签
- java - 我无法获得有关 AngularJS 中验证错误的信息
- r - R dplyr:没有聚合函数的分组
- brython - 如何避免页面上的 Brython 错误?
- amazon-web-services - 了解在 ec2 上运行的 MYsql 服务已关闭的指标
- c# - C# DataGridView 从 SQL(Access) 中的条件绑定不显示数据
- c# - 将字符串列表添加到字典,然后检索它的值
- javascript - 如何向用户输入添加文本 - Vue
- python - 在 scikit-learn 的 TfidfVectorizer 中传递非英文文本