python - 在我的分布样本上绘制钟形曲线
问题描述
我有以下代码:
from pyspark.sql import DataFrame
import plotly.express as px
import matplotlib.pyplot as plt
dfPy = sqlContext.table("df")
pd = dfPy.toPandas()
pd[['col4']].plot(kind='hist', bins=[0,10,20,30,40,50,60,70,80,90,100], rwidth=0.8)
plt.show()
我可以在 Apache Zeppelin notebook 中看到以下运行结果:
可以看出我有两个问题:
如何绘制钟形曲线?似乎分布不是正态分布或高斯分布。所以我想我应该做一些数据转换。正确的?
我现在如何在生成的直方图上绘制钟形曲线?
解决方案
推荐阅读
- python - 我的 django 项目中未解决的导入:VSCode
- python - 元组'对象不能被解释为 autopy 中的整数
- r - 3 cat() 结果在 3 个连续的行上
- c# - 超时已过。操作完成前的超时时间
- jquery - 正则表达式允许包含破折号的数字
- caching - 如何将 Apollo 的 cacheRedirect 与嵌套查询一起使用
- amazon-web-services - AWS Athena 对于 api 来说太慢了?
- r - 使用 .SD 和 by 的 data.table 性能
- python - 如何在 Python 中调整 OpenCV 图像的大小?
- python - 在分布式 Spark DataFrame 上使用 functools reduce