首页 > 解决方案 > 文本分类和特征选择有什么区别

问题描述

我们可以选择没有分类的特征吗?如果我有文本,我怎么知道要选择哪些特征?我需要关于文本的示例而不是真实的单词对象示例。如果有人可以解释一下吗?

标签: machine-learningtext-classificationfeature-selection

解决方案


文本分类是根据文本的特征对文本进行分类。例如,您可以将一个句子分类为具有正面(“我很高兴”)或负面(“我很伤心”)情绪。

文本特征选择有效地决定了您希望如何对文本进行编码,以便您可以通过分类器运行它。有很多方法可以做到这一点。例如,您可以使用一袋词表示,其中每列代表词汇表中的一个词,每个单元格代表该词在文档中出现的次数。

如果你有两个句子,“I am so happy, so very happy”和“I am so sad”,你对句子的编码可能是

| 我 || 上午 | 所以| 快乐 | 非常| 伤心 |

            1. 0。
            1. 1.

推荐阅读