python - 在 Python 中可视化时间序列数据 - 故障排除帮助 + 有关最佳实践的问题
问题描述
我是一名业余编码员,目前在本地企业工作,我正在尝试学习 Python 以进行数据可视化,以用于自己的开发并为业务做出贡献。
我试图绘制的是过去一年收入的各种视觉效果。我想从简单的收入随时间线图开始,但我遇到了一些问题。下面是我的许多尝试之一:
这是它的代码:
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.dates as mdates
import seaborn as sns
file_url = '.../Downloads/Daily Income Report - Daily Totals.csv'
data = pd.read_csv(file_url, header=0, parse_dates=True)
Date = data['Date']
Income = data['Total']
sns.set_theme()
ax = plt.gca()
#ax.xaxis.set_minor_locator(matplotlib.dates.MonthLocator([1, 7]))
#ax.xaxis.set_minor_formatter(matplotlib.dates.DateFormatter('%b'))
ax.xaxis.set_major_locator(mdates.YearLocator())
ax.xaxis.set_major_formatter(mdates.DateFormatter('%Y'))
#ax.tick_params(pad=20)
plt.plot(Date, Income)
plt.show()
如您所见,它存在几个问题。我要解决的主要问题是蜱虫。首先,我不知道 1970 是从哪里来的。我在 Spyder 中这样做,当我查看日期变量时,一切都已正确注册,最早的日期是 2020 年。
从逻辑上讲,它可能与 ax = plt.gca() 之后的最后一段代码有关。我从另一个帖子中提取了它,这个帖子也来自一个试图用大量数据点简洁地可视化时间序列的人。他们和我一样,也有一堆数据点(我有 300 多个,这可能会使图表变得非常混乱)。上面的大部分代码都来自我试图从各种堆栈帖子/YouTube 中综合解决方案。
只要弄清楚如何有效地可视化我的数据,我将不胜感激。那个 1970 是从哪里来的!?!?
解决方案
推荐阅读
- r - 我是否以正确的方式解决这个问题,如果在 group_by 之后
- python - 如何在一个非常大的 numpy 数组上使用 scipy cdist 函数而不会出现内存错误?
- php - 我有使用 PHP 代码动态加载的代码,这里我需要为选项值设置选定的值
- python - 如何匹配标点符号和数字包围的单词
- javascript - Redux - Redux 存储中的数据未更新
- database - 不在范围内:数据构造函数“Song” - Haskell
- python - Python:网页抓取 shopify 网站
- python - 使用 Windows DLL 键入的程序在通过 SSH 调用时不会运行
- python - 我将如何在云环境中同时运行两个 python 脚本?
- javascript - AJAX 脚本在移动设备中使用时不起作用