machine-learning - 数据采样技术和问题
问题描述
我对数据采样有点困惑,我的采样数据应该得到什么分布?一般来说,我是否希望我的采样数据与我的整个数据集具有相同的分布?我想知道什么是合理的采样技术和方法?
解决方案
我没有很好地理解你的问题,但我会尽力回答。Student 't' 分布本质上是一个正态分布(具有近似钟形),这就是为什么统计程序中经常包含 Student 't' 分布而不是正态分布的统计表达式的原因。
推荐阅读
- laravel - 如何在 laravel 应用程序中使用弹性进行搜索而无需雄辩?
- python - 以 numpy 数组为索引的大型表
- jenkins - 詹金斯定期构建调度程序显示错误的时间
- azure-devops - 在 ADO 管道中添加数组类型的管道变量
- android - Android 11 onCreate() 调用每秒钟都丢失
- java - 嵌套类字段上的@Indexed 注释不起作用
- java - maxOccuringDigit() 函数的时间和空间复杂度是多少?
- garbage-collection - 堆转储上的 JVM GC 行为和不必要的堆使用
- php - 如何将多个主机从 traefik 2 定向到一个 nginx
- sql - graphql和sql有什么区别