machine-learning - 使用稀疏矩阵预测线性分类器
问题描述
我正在使用稀疏矩阵使用 OnevsRestClassifier 训练逻辑回归估计器。特征集非常大(约 160 万)。
当分类器必须进行预测时,它会引发一个异常,即测试数据和训练数据中的特征数量不相等。
我无法理解在稀疏矩阵表示方面如何期望特征数量相等。例如,这是我的基本代码片段:
classifier = OneVsRestClassifier(LogisticRegression())
classifier = classifier.fit(X_train, y_train)
predicted = classifier.predict(X_test)
这里 X_train 和 X_test 的形状明显不同。
print X_train.shape
(11, 1617899)
print X_test.shape
(3, 83715)
所以引发了一个异常:
ValueError: X has 83715 features per sample; expecting 1617899
(小源代码探测告诉我linear_model/base.py 在decision_function() 中进行了比较)
我怎样才能解决这个问题?
解决方案
推荐阅读
- jestjs - 在 .toMatchObject 中使用 Jest 匹配器
- php - 如何将两个 id 从 URL 传递到 laravel 中的控制器
- django - 在 PasswordChangeView 中实现“LOGOUT”功能的合适位置在哪里?
- html - 具有非等距子项的 css 等距视图
- vue.js - 删除了节点模块,现在出现“错误:找不到模块 'webpack/lib/RuleSet'”错误
- php - Codeigniter 3:如何避免在我的控制器中重复这段代码?
- sql - 我如何编写查询以显示具有该专业的规范 ID 和员工人数
- php - Cognito:从浏览器将文件上传到 S3 到自定义用户子文件夹
- python - 将 django 模型连接到具有相同结构的不同表名
- node.js - 如何在类验证器模式中传递映射参数