python - 在 python 中为分类问题生成合成数据的正确开始
问题描述
我有一个包含 9 个特征和 1300 行的数据集。我试图在我拥有的当前数据上生成合成数据。输出分为 2 个选项。即 1 和 0 是(1-是和 0-否)这里的问题是几乎 1100 个案例的输出为“0”,而 200 个案例的输出为“1”。以前,我尝试过训练,但结果并不好。我的教授建议我研究合成数据并增加输出“1”的案例,以便有助于开发机器学习模型。我对合成数据一无所知。我承认。我只是不知道从哪里开始。有人可以帮忙吗?如何解决这类问题。任何建议表示赞赏?任何参考代码都对学习有用。谢谢
解决方案
推荐阅读
- bash - 在shell脚本中删除“=”符号之前的字符串
- javascript - 对下一个值 javascript 求和的更好方法
- javascript - Ember-Template-Lint 如何修复 hbs 文件上的块缩进错误?
- wso2 - wso2 quickfixj fix.4.2 来自代理的消息
- tcl - 想要使用 tcl/Tcl 或 Python 拒绝前三行以及每行中的点(。)
- database - 使用 Flyway 我可以在特定版本之后迁移吗?
- memory-leaks - Windows中的内存泄漏是否比Linux中的更糟?
- logstash - logstash根据日志文件路径在elasticsearch中创建索引
- python-3.x - 为 PLSR 建模运行 Python 代码时出错
- c - 如何将结构成员定义为其他成员的总和