首页 > 解决方案 > 在 Python 中可视化时间序列数据 - 故障排除帮助 + 有关最佳实践的问题

问题描述

我是一名业余编码员,目前在本地企业工作,我正在尝试学习 Python 以进行数据可视化,以用于自己的开发并为业务做出贡献。

我试图绘制的是过去一年收入的各种视觉效果。我想从简单的收入随时间线图开始,但我遇到了一些问题。下面是我的许多尝试之一:

线图尝试

这是它的代码:

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.dates as mdates
import seaborn as sns

file_url = '.../Downloads/Daily Income Report - Daily Totals.csv'

data = pd.read_csv(file_url, header=0, parse_dates=True)

Date = data['Date']
Income = data['Total']

sns.set_theme()

ax = plt.gca()
#ax.xaxis.set_minor_locator(matplotlib.dates.MonthLocator([1, 7]))
#ax.xaxis.set_minor_formatter(matplotlib.dates.DateFormatter('%b'))
ax.xaxis.set_major_locator(mdates.YearLocator())
ax.xaxis.set_major_formatter(mdates.DateFormatter('%Y'))
#ax.tick_params(pad=20)

plt.plot(Date, Income)
plt.show()

如您所见,它存在几个问题。我要解决的主要问题是蜱虫。首先,我不知道 1970 是从哪里来的。我在 Spyder 中这样做,当我查看日期变量时,一切都已正确注册,最早的日期是 2020 年。

从逻辑上讲,它可能与 ax = plt.gca() 之后的最后一段代码有关。我从另一个帖子中提取了它,这个帖子也来自一个试图用大量数据点简洁地可视化时间序列的人。他们和我一样,也有一堆数据点(我有 300 多个,这可能会使图表变得非常混乱)。上面的大部分代码都来自我试图从各种堆栈帖子/YouTube 中综合解决方案。

只要弄清楚如何有效地可视化我的数据,我将不胜感激。那个 1970 是从哪里来的!?!?

标签: pythonmatplotlibtime-series

解决方案


推荐阅读