python - 如何从一组稀疏矩阵构建训练数据
问题描述
我正在尝试为 2 类分类问题(比如 A 类和 B 类)建立一个模型。我有两个数据集,我想从中生成训练、测试和验证数据集(如下所示):
Dataset-1:该数据集有 1092 个 A 类样本,每个样本作为 1481x163 的特征矩阵和 1 个标签(即 A 类)。该数据集的每个样本都具有相同的索引,长度为 1481(假设是一组生物标志物)和相同的 163 个特征。矩阵非常稀疏。
数据集 2:该数据集是 82 个 B 类样本,其中每个样本具有与 A 类相同大小的特征矩阵(即 1481 个生物标志物 x 163 个特征)和 1 个标签(即 B 类)。在这里,矩阵也非常稀疏。
我想为两类分类建立一个模型,但我的问题是如何通过组合两个类来生成一个单一的特征矩阵(尤其是对于非人工神经网络模型,如 RF、SVM 等)。通过每个矩阵的垂直或水平展平然后将它们连接起来可能没有用,因为数组的大小将非常大,并且很难从 163 个特征中找到重要特征。
请建议。
解决方案
推荐阅读
- react-native - RNFetchBlob.fs.mkdir executes successfully but doesn't create directory
- asp.net - Wrong dependency to IIS restart for getting changed data in SQL Server
- bash - 尝试使用 bash 从特定字符串 NumberLong("43494254014573") 中提取数字时出现命令未找到错误
- ios - SwiftUI:如何创建具有相同行数和列数的 LazyGrid?
- flutter - 未定义 Flutter 扩展
- javascript - 如何在 JavaScript 的 setInterval 中运行异步函数
- git - Git 添加并提交一个已经被跟踪的目录
- c - C win32 api中同步编程中的重复障碍
- javascript - 如何将新项目添加到对象中
- amazon-web-services - Terraform aws 错误创建 IAM 角色 ecs_task_execution_role: MalformedPolicyDocument: 已禁止字段资源