首页 > 解决方案 > 我应该使用哪种深度学习模型来分类具有多标签的多类问题

问题描述

我想开发一个深度学习模型来对一些评论和评论进行分类。下面是数据结构的一点说明:

每个评论可能与一个或多个类别相关,例如关于手机电池、手机操作系统或其他类别的评论(类型分析)。

每条评论(例如关于手机电池及其操作系统的评论)可能是正面的、负面的或中性的,只是其中之一(情绪分析)。

现在的问题是,我是否应该开发多个模型(每个类一个模型),该模型具有 3 个情绪输出,如下所示:

DATA ==> TYPE DETECTION MODEL ==> output_1 (type of review)

DATA ==> SENTIMENT DETECTION MODEL ==> output_2 (sentiment of review)

REAL OUTPUT ==> output_1 + output_2

或者我应该开发一个类,通过所有可能性(所有类型 * 所有情绪)对数据进行分类,如下所示:

DATA ==> DETECT TYPE AND SENTIMENT MODEL ==> REAL OUTPUT

哪个是更好的方法,或者如果有另一种我不知道的方法,如果您告诉我,我将不胜感激。

标签: algorithmdeep-learningmodelmultilabel-classificationmulticlass-classification

解决方案


我会使用情绪分析模型和每个主题的二元分类模型。

我不会将主题分类与情绪分析结合起来。这是两个独立的任务,每个任务都有自己的模型。

至于主题分类本身,我倾向于每类单独的模型,原因有二:

首先,通过这种方式,我们可以获得每个类的全部激活值。例如,如果一个文本与 A 类和 B 类都非常匹配,我们可以期望两个相应的模型来表明这一点,而如果我们使用一个模型,很可能这些类中只有一个会脱颖而出。

其次,使用单独的分类器构建的模型更具可扩展性。添加另一个主题相当于在该主题上训练一个新的分类器。如果我们使用一个大分类器,添加一个主题需要在所有主题上重新训练模型。


推荐阅读