python - 我如何使用 Python 来识别导致趋势增加和减少的因素(类似于 Power BI 的 Insights 功能)
问题描述
Power BI 的最佳功能之一是能够识别对趋势增加和减少最有影响的因素。据我了解,机器学习方法用于产生结果。更多信息:https ://docs.microsoft.com/en-us/power-bi/desktop-insights
使用 Python 识别对数据集中趋势增加和减少最有贡献的因素的最佳方法是什么?
解决方案
您的问题可能有很多答案,因为您可以使用线性和非线性方法来探索自变量变化与目标变量之间的依赖关系。具有高解释能力的最简单方法之一是基于决策树分类器的 python 包 scikit-learn 中的函数 .feature_importances_。一旦有了自变量 X 和目标 y,语法就非常简单:
forest = ExtraTreesClassifier(n_estimators=250,
random_state=0)
forest.fit(X, y)
importances = forest.feature_importances_
您可以在 http://scikit-learn.org/stable/auto_examples/ensemble/plot_forest_importances.html查看更多详细信息
推荐阅读
- sas - 在SAS中重命名数据集中的标题
- python - 仅当输入为无时,如何对 Python 函数进行类型注释以将其标记为返回无?
- python - 在pyqt上流式传输opencv视频时它可以工作,但是为什么在使用dlib编写代码时它不起作用?
- regex - 正则表达式允许除字符 0 之外的所有字符
- python - 我有两个只有 3 列共有的 excel 文件,我想合并其余信息以获得一个新的 excel 文件
- sql - 我们可以在表的特定分区上创建视图吗
- java - 如何从spring的application.properties定义和读取对象数组?
- python - 如何将字符串拆分为字符串和整数?
- amazon-web-services - AWS IAM 角色能否用于在 AWS 之外运行的应用程序?
- javascript - 扩展两个 JOI 验证基础架构