首页 > 解决方案 > 如何使用 Seaborn Heatmap 选择日期频率和显示日期

问题描述

我有一个包含几列和日期作为索引的 DataFrame。我用sns.heatmap它来绘制它,日期在 y 轴上。我想强制刻度仅显示每年的 10 月 1 日。我在 heatmap seaborn 的Date 轴上使用了@Ayrton Bourn 给出的解决方案,它允许我更改刻度的频率,但不能更改显示日期的日期。到目前为止,他的方法是唯一允许我选择 y-ticks 频率的方法。我尝试使用mdates.YearLocator()set_major_locator没有成功。

使用下面的代码,您有什么建议可以让我选择日期刻度的频率(每年)和显示的日期(例如,每个 '200x-10-01')?

import numpy as np
from datetime import date, datetime, timedelta
import pandas as pd
import seaborn as sns
import matplotlib.dates as mdates
import matplotlib.pyplot as plt
from collections.abc import Iterable
from sklearn import linear_model

class AxTransformer:
    def __init__(self, datetime_vals=False):
        self.datetime_vals = datetime_vals
        self.lr = linear_model.LinearRegression()
        
        return
    
    def process_tick_vals(self, tick_vals):
        if not isinstance(tick_vals, Iterable) or isinstance(tick_vals, str):
            tick_vals = [tick_vals]
            
        if self.datetime_vals == True:
            tick_vals = pd.to_datetime(tick_vals).astype(int).values
            
        tick_vals = np.array(tick_vals)
            
        return tick_vals
    
    def fit(self, ax, axis='x'):
        axis = getattr(ax, f'get_{axis}axis')()
        
        tick_locs = axis.get_ticklocs()
        tick_vals = self.process_tick_vals([label._text for label in axis.get_ticklabels()])
        
        self.lr.fit(tick_vals.reshape(-1, 1), tick_locs)
        
        return
    
    def transform(self, tick_vals):        
        tick_vals = self.process_tick_vals(tick_vals)
        tick_locs = self.lr.predict(np.array(tick_vals).reshape(-1, 1))
        
        return tick_locs
    
def set_date_ticks(ax, start_date, end_date, axis='y', date_format='%Y-%m-%d', **date_range_kwargs):
    dt_rng = pd.date_range(start_date, end_date, **date_range_kwargs)

    ax_transformer = AxTransformer(datetime_vals=True)
    ax_transformer.fit(ax, axis=axis)
    
    getattr(ax, f'set_{axis}ticks')(ax_transformer.transform(dt_rng))
    getattr(ax, f'set_{axis}ticklabels')(dt_rng.strftime(date_format))

    ax.tick_params(axis=axis, which='both', bottom=True, top=False, labelbottom=True)
    
    return ax




base = datetime(2000, 1, 1)
arr = np.array([base + timedelta(days=i) for i in range(366*3)])


val = np.random.rand(len(arr),3)
df = pd.DataFrame(val, index = arr)

f, ax = plt.subplots(figsize=(20,20))

ax = sns.heatmap(df, ax = ax)
set_date_ticks(ax, '2000-01-01', '2003-12-01', freq='1Y')
ax.format_ydata = mdates.DateFormatter('% Y')
plt.show()

标签: dataframedateplotseabornheatmap

解决方案


我通过查看 Kwargs 找到了解决方案。要选择显示的日期,唯一需要更改的是“freq =”(请参阅​​此处的详细频率列表)。就我而言,为了显示每年的 10 月 1 日,我只需将开始日期更改为 10 月 1 日,并指定我希望刻度在每 12 个月的开始(结束日期无关紧要):

f, ax = plt.subplots(figsize=(20,20))

ax = sns.heatmap(df, ax = ax)
set_date_ticks(ax, '2000-10-01', '2004-10-01', freq='12MS')
ax.format_ydata = mdates.DateFormatter('% Y')
plt.show()

推荐阅读