keras - 如何使用 keras 实现多标签分类神经网络
问题描述
我正在尝试使用 Keras 实现一个神经网络,该网络存在涉及多标签分类的问题。我知道解决问题的一种方法是将其转换为几个二元分类问题。我已经实现了其中一个,但不确定如何与其他人一起进行,主要是如何将它们结合起来?我的数据集有 5 个输入变量和 5 个标签。通常,单个数据样本将具有 1-2 个标签。很少有超过两个标签。
这是我的代码(感谢 machinelearningmastery.com):
import numpy
import pandas
from keras.models import Sequential
from keras.layers import Dense
from keras.wrappers.scikit_learn import KerasClassifier
from sklearn.model_selection import cross_val_score
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import StratifiedKFold
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import Pipeline
# fix random seed for reproducibility
seed = 7
numpy.random.seed(seed)
# load dataset
dataframe = pandas.read_csv("Realdata.csv", header=None)
dataset = dataframe.values
# split into input (X) and output (Y) variables
X = dataset[:,0:5].astype(float)
Y = dataset[:,5]
# encode class values as integers
encoder = LabelEncoder()
encoder.fit(Y)
encoded_Y = encoder.transform(Y)
# baseline model
def create_baseline():
# create model
model = Sequential()
model.add(Dense(5, input_dim=5, kernel_initializer='normal', activation='relu'))
model.add(Dense(1, kernel_initializer='normal', activation='sigmoid'))
# Compile model
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
scores = model.evaluate(X, encoded_Y)
print("\n%s: %.2f%%" % (model.metrics_names[1], scores[1]*100))
#Make predictions....change the model.predict to whatever you want instead of X
predictions = model.predict(X)
# round predictions
rounded = [round(x[0]) for x in predictions]
print(rounded)
return model
# evaluate model with standardized dataset
estimator = KerasClassifier(build_fn=create_baseline, epochs=100, batch_size=5, verbose=0)
kfold = StratifiedKFold(n_splits=10, shuffle=True, random_state=seed)
results = cross_val_score(estimator, X, encoded_Y, cv=kfold)
print("Results: %.2f%% (%.2f%%)" % (results.mean()*100, results.std()*100))
解决方案
您所指的方法是多标签分类的一对一或一对一策略。然而,当使用神经网络时,对于具有 5 个标签的多标签分类问题,最简单的解决方案是使用具有 5 个输出节点的单个模型。使用 keras:
model = Sequential()
model.add(Dense(5, input_dim=5, kernel_initializer='normal', activation='relu'))
model.add(Dense(5, kernel_initializer='normal', activation='sigmoid'))
model.compile(loss='binary_crossentropy', optimizer='sgd')
您可以将训练标签作为长度为 5 的二进制编码向量提供。例如,对应于类 2 和 3 的示例将具有标签[0 1 1 0 0]
。
推荐阅读
- amazon-web-services - 在多个 EC2 实例上使用 HTTPS,并更改公共 IPv4 DNS
- reactjs - 我正在尝试将 DatePicker 组件插入到我的项目中,但出现错误
- ibm-cloud - 是否有适用于 IBM Cloud PowerPC Virtual 服务器实例的 API - power-iaas?
- bamboo - SSH 远程文件执行
- javascript - 如何从其键值对更改对象的值并将这个新项目迭代地添加到同一个对象?
- python - 根据字典中的值列表在 pandas 中创建一个新列
- sql - count(*) 并且没有选择相同的日期
- nlp - 安装 ktrain 时,出现错误:无法为使用 PEP 517 且无法直接安装的 h5py 构建轮子。有什么解决办法吗?
- r - Rowwise 在数据框列中查找最常见的术语并计算出现次数
- quarkus - 如何在 Quarkus 中使用 Jasypt 加密和解密数据库密码