python - 如何可视化分类特征与日期列
问题描述
在我的数据集中,我有一个名为“类型”的分类列包含(例如,INVOICE,IPC,IP),“日期”列包含日期(例如,2014-02-01)。我怎样才能绘制这两个。在 x 轴上我想要日期在 y 轴上(例如 INVOCE)的一条线显示其趋势
解决方案
不太清楚你所说的绘图和显示趋势是什么意思,一种方法是像@QuangHoang 建议的那样计数,并使用热图进行绘图,如下所示。如果有什么不同,请扩展您的问题。
import pandas as pd
import numpy as np
import seaborn as sns
dates = pd.date_range(start='1/1/2018', periods=5, freq='3M')[np.random.randint(0,5,20)]
type = np.random.choice(['INVOICE','IPC','IP'],20)
df = pd.DataFrame({'dates':dates ,'type':type})
tab = pd.crosstab(df['type'],df['dates'].dt.strftime('%d-%m-%Y'))
n = np.unique(tab.values)
cmap = sns.color_palette("BuGn_r",len(n))
sns.heatmap(tab,cmap=cmap)
推荐阅读
- python - 分组行之间的 Pandas 过滤
- neo4j - 针对远程 neo4j 启动 GraphQL Architect 时出错
- sql - 链接服务器的 OLE DB 提供程序“OraOLEDB.Oracle”返回消息“ORA-00904:标识符无效
- chart.js - 删除/隐藏(显示:无)小型移动视图中的图形图表 - JS图表
- php - 如何在 Woocommerce 中使用 html 显示费用
- c - 多线程:使用信号量和互斥量的生产者消费者问题中的分段错误
- python - 无法从for循环中的列表中删除元素
- python - 在 pandas 中完全过滤带有字符串列表和 NaN 的行
- python - 如何使用networkx在python中将数量值填充到网络中?
- r - 将带有参数的方法作为字符串传递,并在 R 中作为方法(而不是字符串)分配给变量时