python - 基于字典创建 altair 图表:传递 pandas 数据框的问题
问题描述
我正在尝试以编程方式生成不同的 altair 图表。我将这些不同的图表设置基于带有alt.Chart.from_dict()
.
我已经使用现有图表执行chart.to_dict()对图表的整体配置进行了逆向工程,但是这种方法将数据序列化为json,而我的数据托管在pandas数据帧中,我正在努力寻找正确的语法传递数据帧的字典。
我尝试了以下几种变体:
d_chart_config = {
"data": df, #or df.to_dict()
"config": {
"view": {"continuousWidth": 400, "continuousHeight": 300},
"title": {"anchor": "start", "color": "#4b5c65", "fontSize": 20},
},
"mark": {"type": "bar", "size": 40},
....}
但还没有弄清楚如何或在字典中插入数据帧的位置,无论是直接作为数据帧还是作为 df.to_dict()
如果您管理过类似的事情,请提供帮助。
解决方案
生成 Vega-Litedata
字段的纯 pandas 方法是{"values": df.to_dict(orient="records")}
,但这在某些情况下会出现问题(即处理日期时间、分类和非标准数字和字符串类型)。
Altair 具有解决这些问题的实用程序,您可以直接使用这些实用程序,即altair.utils.data.to_values
函数。
例如:
import pandas as pd
from altair.utils.data import to_values
df = pd.DataFrame({'a': [1, 2, 3], 'b': pd.date_range('2012', freq='Y', periods=3)})
print(to_values(df))
# {'values': [{'a': 1, 'b': '2012-12-31T00:00:00'},
# {'a': 2, 'b': '2013-12-31T00:00:00'},
# {'a': 3, 'b': '2014-12-31T00:00:00'}]}
您可以直接在包含 vega-lite 规范的字典中使用它并生成有效图表:
alt.Chart.from_dict({
"data": to_values(df),
"mark": "bar",
"encoding": {
"x": {"field": "a", "type": "quantitative"},
"y": {"field": "b", "type": "ordinal", "timeUnit": "year"},
}
})
推荐阅读
- r - 用基于另一列中特定字符串的平均值修改 df 中的列
- java - 无法从 STATT_OBJECT 令牌中反序列化 java.util.ArrayList 的实例
- php - 如何通过 PHP / Symfony 处理大型 gzip HTTP 响应
- kubernetes - Ansible 从文件中创建 kubernetes 机密
- javascript - Discord.js 我发出警告命令,使用 FS 写入文件
- c - 在 C 中使用时间函数的计时器
- json - 循环中异步返回字符串的问题
- android - 如何使用 DataBinding 从 Activity 访问 Fragment 视图?
- python - Tensorflow 随机分段错误
- css - 在 wordpress 插件中使用 material-ui 进行反应:css 特异性问题