python-3.x - 如何选择最适合的机器学习算法
问题描述
虽然经常运行机器学习算法,但在这种情况下,准确性正在发生变化,如何为该特定数据集选择最适合的算法。
解决方案
让我们假设,每次我们通过将预测响应与我们的测试数据相关值(Y)进行比较来运行准确性时,问题都是针对相同的数据集 X(训练)。如果我们运行模型时准确性不断变化,那么问题在于采样偏差(训练和测试数据的划分是一个谜)。
当您导入 train_test_split 函数时,请明智地使用 random_state 属性来保持测试数据对整个数据群体的代表性。
推荐阅读
- javascript - 如何在 JavaScript 中获取日期的年份
- c# - HostingEnvironment.MapPath 在 .net 项目中返回 null
- r - 将每周数据转换为时间序列“ts”对象
- javascript - 如果 \n 存在于字符串中,则打字稿
- android - 为什么我的应用在设计模式和模拟器上看起来不同?
- node.js - Heroku https://www 重定向到 https://
- ios - 如何在 UIPinchGestureRecognizer 中限制缩放缩放的最大/最小比例
- spring - 如何从在另一个 JVM 上运行的 Spring IOC 容器中获取 bean?
- java - java字符串拆分后获取拆分值
- javascript - 在 three.js 中应用 GLSL 着色器反射时对象颜色发生变化