首页 > 解决方案 > 如何突出显示 Altair 热图中的列?

问题描述

我想将读者的注意力引导到热图中的某些列(或行和列)上,同时仍保留完整的上下文。

我可以alt.condition用来改变颜色和不透明度。两者都在某种程度上起作用。但是不透明度的变化以与价值变化类似的方式可视化。并且使用不同的颜色会改变对价值观的看法。我想做的是在我想要突出显示的连续列周围放置黄色或红色边框。

这就是我现在所拥有的。还有其他想法吗?

    import altair as alt
    alt.data_transformers.disable_max_rows()
    
    def create_att_chart(df, keys_to_highlight=[], width=150, height=150, title=None, labels_x=True, labels_y=True):
        
        properties = {}
        if title:  
            properties['title'] = title  
         
        if width:  properties['width']  = width
        if height: properties['height'] = height
            
        chart = alt.Chart(df).mark_rect().encode(
            x=alt.X('k:N', sort=None, axis=alt.Axis(labels=labels_x, title=None, ticks=False), title=None),
            y=alt.Y('q:N', sort=None, axis=alt.Axis(labels=labels_y, title=None, ticks=False), title=None),
            opacity=alt.Opacity('a:Q', legend=None),
            column=alt.Column('h:N', title=None, header=alt.Header(labels=False), spacing=0.), 
            row=   alt.Row(   'l:N', title=None, header=alt.Header(labels=False), spacing=5.))
            
        if keys_to_highlight:
            chart = chart.encode(
                color=alt.condition(
                    alt.Predicate(alt.FieldOneOfPredicate(field='k', oneOf=keys_to_highlight)),
                    alt.value('orange'),
                    alt.value('blue')))
        else:
            chart = chart.encode(color=alt.value('blue'))
        
        return chart.properties(**properties)

    [..]

    ((create_att_chart(df_pt, ['sage', '##maker'], title='Pre-Trained') | create_att_chart(df_ft, ['sage', '##maker'], title='Fine-Tuned', labels_y=False)).properties(padding=0))

截屏

标签: pythonaltair

解决方案


您可以尝试使用stroke编码条件而不是color,但我认为这会给您在每个框周围的笔划,这可能不是您想要的。相反,您可以使用mark_rulemark_rect与文档中的此示例一起使用:

import altair as alt
import numpy as np
import pandas as pd

# Compute x^2 + y^2 across a 2D grid
x, y = np.meshgrid(range(-5, 5), range(-5, 5))
z = x ** 2 + y ** 2
# Convert this grid to columnar data expected by Altair
source = pd.DataFrame({'x': x.ravel(), 'y': y.ravel(), 'z': z.ravel()})

heatmap = alt.Chart(source).mark_rect().encode(
    x='x:O',
    y='y:O',
    color=alt.Color('z:Q', scale=alt.Scale(scheme='blues')))

现在添加规则:

rule1 = alt.Chart(df).mark_rule(stroke='orange', strokeWidth=2).encode(x=alt.value(20))
rule2 = alt.Chart(df).mark_rule(stroke='orange', strokeWidth=2).encode(x=alt.value(60))
heatmap + rule1 + rule2

在此处输入图像描述

顶级规则可能更吸引人/更优雅,如果需要,您可以在其上方添加带有 mark_text 的文本:

rule1 = alt.Chart(df).mark_rule(stroke='orange', strokeWidth=3).encode(
    y=alt.value(-5),
    x=alt.value(20),
    x2=alt.value(60))
heatmap + rule1

在此处输入图像描述

mark_rect有效,但在正方形中间添加线条,因为比例是有序的,并且定量的 mark_rect 会弄乱轴:

df = pd.DataFrame({'x': [0], 'x2': [3]})
box = alt.Chart(df).mark_rect(color='', stroke='orange', strokeWidth=2).encode(
    x='x:O',
    x2=alt.X2('x2:O', title='x'))
heatmap + box

在此处输入图像描述

如果您尝试在其间添加线条,则会创建新的序轴标记。您可以滥用这一点并通过分隔使线条变白以突出显示,但轴上的刻度仍然存在,因此您必须使用lablExpr或类似方法删除它们。

df = pd.DataFrame({'x': [0.5], 'x2': [3.5]})
box = alt.Chart(df).mark_rect(color='', stroke='white').encode(
    x='x:O',
    x2=alt.X2('x2:O', title='x'))
(heatmap + box).configure_view(stroke=None)

在此处输入图像描述


推荐阅读