首页 > 解决方案 > 如何计算描述性统计;从数据集中选择特征的偏度和峰度?

问题描述

我需要在 python 中正确地从数据框中找到所选特征的偏度和峰度。

目标(y)特征是我需要的选定特征。

import pandas as pd
import numpy.random as rd
data = pd.read_csv('data4filter2.csv')
columns = ['Development Platform','Language Type','Adjusted Function Points','Resource Level']
y = data['Normalised Work Effort'].values
X = data[list(columns)].values

块引用

标签: pythonkurtosis

解决方案


我猜标准化数据是“标准化工作量”列(只是因为名称?-​​是的,没有更多信息并回答问题)

from scipy.stats import skew
from scipy.stats import kurtosis

print(skew(y))
1.4698391946407465
print(kurtosis(y))
0.5414032993205269

推荐阅读