python - 如何计算描述性统计;从数据集中选择特征的偏度和峰度?
问题描述
我需要在 python 中正确地从数据框中找到所选特征的偏度和峰度。
目标(y)特征是我需要的选定特征。
import pandas as pd
import numpy.random as rd
data = pd.read_csv('data4filter2.csv')
columns = ['Development Platform','Language Type','Adjusted Function Points','Resource Level']
y = data['Normalised Work Effort'].values
X = data[list(columns)].values
解决方案
我猜标准化数据是“标准化工作量”列(只是因为名称?-是的,没有更多信息并回答问题)
from scipy.stats import skew
from scipy.stats import kurtosis
print(skew(y))
1.4698391946407465
print(kurtosis(y))
0.5414032993205269
推荐阅读
- javascript - 不确定如何在此应用中包含启动/停止计时器功能
- firebase - 在保留 StreamProvider 的同时,无法将 Flutter Firebase_Auth 从版本 0.15 更新到 0.18
- python - 程序在 if 语句后自动结束
- c# - 使用图片框 C# windows 窗体创建 Snake 游戏
- swift - 快速播放某种类型的音频文件时出错
- ios - Obj-C - 按钮点击上的呼叫号码崩溃应用程序?
- javascript - Strapi 自定义端点不可用,未找到返回
- php - Dompdf 表格不适合
- spring-data-jpa - 使用 Spring Data JPA/Rest 的简单标记实现
- python - How do I handle a disconnect with python sockets? (ConnectionResetError)