python - 构建分类器时如何对输入特征之间的依赖关系进行建模
问题描述
我有形状为 (1000,20) 的数据集(1000 行,20 个特征),我想为它构建一个分类器。然而,大多数 sk-learn 算法都假设这 20 个特征是独立的。在我的功能中,功能之间存在高斯依赖性。如何将此依赖关系建模为 SVM 或 ExtraTreeClassifier 等分类器的输入?
谢谢
解决方案
使用与线性不同的内核。
由于您提到您的功能之间存在高斯依赖性,我认为基于径向函数的RBF内核最适合您。
我知道的任何 SVM 库都有这个内核选项。例如,您可以在此处查看 SVM 的 scikit-learn 文档。让我们看看我从该页面获取的示例:
from sklearn.svm import SVC
clf = SVC(gamma='auto')
clf.fit(X, y)
SVC(C=1.0,cache_size=200,class_weight=None,coef0=0.0,decision_function_shape='ovr',degree=3,gamma='auto',kernel='rbf',max_iter=-1,probability=False,random_state =无,缩小=真,tol=0.001,详细=假)
如您所见,内核默认设置为rbf,因此您可以随意使用它。
推荐阅读
- node.js - FetchError:节点获取在执行间隔时返回“无效的 json 响应正文”
- javascript - 如何使位置绝对尊重垂直视口限制
- javascript - 在 Next.js 中进行客户端重新加载和更改 url
- node.js - javascript,nodejs。找不到模块“了不起”
- android - 如何在 android studio 中解决这个问题?
- ios - 如何快速从数组中的数组中获取数据
- sql - 如何在 SQL 查询中选择 Openrow 集中的动态工作表名称?
- javascript - MutationObserver 作为对象的属性在断开连接后无法立即观察
- python - 有没有办法从谷歌搜索中提取问题的答案
- javascript - javascript循环关闭具有相应按钮类号的div