sql - 如何计算每个州的基尼系数(例如外部来源)?
问题描述
我正忙着在 SQLite 中乱搞,想根据人均收入中位数和每个县的人口计算每个美国州的基尼系数。
该过程在这里解释:https ://medium.com/google-cloud/calculating-gini-coefficient-in-bigquery-3bc162c82168
只有我不知道如何为我的特定数据集执行此操作。我知道我需要确定每个县的收入和人口百分比,然后将每个州的数据汇总以获得累积值,但除此之外我完全迷失了。
然后输出将是每个州的基尼系数,但不知道如何使用这些值创建一个新实体。
我的数据集示例如下,虽然不完整,但应该有足够的数据让它工作。
状态 | 县 | 总流行音乐 | 人均收入 | |
---|---|---|---|---|
阿拉巴马州 | 奥陶加 | 55221 | 24974 | |
阿拉巴马州 | 鲍德温 | 195121 | 27317 | |
阿拉巴马州 | 巴伯 | 26932 | 16824 | |
阿拉巴马州 | 比布 | 22604 | 18431 | |
阿拉巴马州 | 布朗特 | 57710 | 20532 | |
阿拉巴马州 | 犍 | 10678 | 17580 | |
阿拉巴马州 | 巴特勒 | 20354 | 18390 | |
阿拉巴马州 | 卡尔霍恩 | 116648 | 21374 | |
阿拉巴马州 | 钱伯斯 | 34079 | 21071 | |
阿拉巴马州 | 切诺基 | 26008 | 21811 | |
阿拉斯加州 | 布里斯托尔湾区 | 970 | 38267 | |
阿拉斯加州 | 德纳利区 | 2060 | 35315 | |
阿拉斯加州 | 迪林厄姆人口普查区 | 4979 | 22257 | |
阿拉斯加州 | 费尔班克斯北极星自治市镇 | 99705 | 33244 | |
阿拉斯加州 | 海恩斯自治市镇 | 2560 | 33902 | |
阿拉斯加州 | Hoonah-Angoon 人口普查区 | 2128 | 30943 | |
阿拉斯加州 | 朱诺市和自治市镇 | 32531 | 39979 | |
阿拉斯加州 | 基奈半岛自治市镇 | 57221 | 31537 | |
阿拉斯加州 | 凯奇坎门户自治市镇 | 13699 | 32021 | |
阿拉斯加州 | 科迪亚克岛自治市镇 | 13973 | 30657 |
解决方案
推荐阅读
- javascript - 键入'字符串 | 结果 []' 不可分配给类型 'NgIterable
| 空 | 不明确的' - c++ - C中的向量化/向量化函数
- testng - 如何为数据驱动测试中的每个测试设置超时
- r - 在 R 中的 for/if 循环中替换 NA
- sql - 在 SQL 中解析格式错误的字符串
- python - 在 Numpy 中结合广播和布尔数组索引进行图像屏蔽
- angular - 如何将角度数据表功能与 jhipster 合并
- javascript - 仅在 js 文件中添加用于导入对象的脚本后出错:无法读取 null () 的属性“addEventListener”
- json - 如何解决错误:'缺少参数'data','detailedData'在调用中的参数'
- ios - 将 NSBatchInsertRequest 的 JSON 对象列表转换为 [[String:Any]] 失败