machine-learning - 文本分类和特征选择有什么区别
问题描述
我们可以选择没有分类的特征吗?如果我有文本,我怎么知道要选择哪些特征?我需要关于文本的示例而不是真实的单词对象示例。如果有人可以解释一下吗?
解决方案
文本分类是根据文本的特征对文本进行分类。例如,您可以将一个句子分类为具有正面(“我很高兴”)或负面(“我很伤心”)情绪。
文本特征选择有效地决定了您希望如何对文本进行编码,以便您可以通过分类器运行它。有很多方法可以做到这一点。例如,您可以使用一袋词表示,其中每列代表词汇表中的一个词,每个单元格代表该词在文档中出现的次数。
如果你有两个句子,“I am so happy, so very happy”和“I am so sad”,你对句子的编码可能是
| 我 || 上午 | 所以| 快乐 | 非常| 伤心 |
-
0。
-
1.
推荐阅读
- dictionary - 如何使用机器人框架从数组中读取键?
- linux - 如何删除文件夹和子文件夹中的文件以腾出空间
- matlab - 位置霍尔效应传感器的数据校正
- c++ - 显示每门课程的学生人数
- python - 使用python将excel枢轴布局更改为一维数据集
- angular - 无法在 Angular 中读取打字稿中的属性
- vue.js - @Nuxt/Apollo 如何从 gql 查询中删除“__typeName”
- javascript - 检查页面是否包含文本,如果为 true,则使用 javascript 将类添加到父类
- highcharts - 如何翻译标签“X 周”?
- javascript - 导航栏中选择菜单的定位