首页 > 解决方案 > 数据类型转换问题

问题描述

[ https://github.com/rgrantham82/Hate_Crimes_Analysis/blob/master/Data%20Wrangling%20(1).ipynb]

如果上述链接不起作用,请使用 [ https://github.com/rgrantham82/Hate_Crimes_Analysis]并单击 Data Wrangling Jupyter notebook。

我目前正在分析德克萨斯州奥斯汀的仇恨犯罪数据。到目前为止,我正处于它的清洁阶段,我对如何最好地进行脑放屁。

到目前为止,我连接了来自 data.austintexas.gov 的 4 个数据集——报告了从 2017 年至今的仇恨犯罪。结果集产生了几个新列,因为原始数据列,尤其是“日期...”、“受害者...”和“犯罪者...”列的格式都由创建者/策展人不同(s)......无论你为 austintexas.gov 工作的人都做得很好......无论如何,我现在的目标是:

  1. 对我而言,最重要的列是“偏差”列。如何将数据转换为数值类型?我无法用 Matplotlib bc 可视化它,显然它不是数字的。

  2. 以某种方式将“事件编号”数据转换为日期时间。或其他一些数值数据类型,以使可视化更好。

除非可以清理和合并各种“日期”列并转换它们,但最简单的方法似乎是操纵“事件编号”列。

顺便说一句,我是 Python 的新手。非常感谢任何帮助,但我也非常愿意接受建议等。谢谢大家!

标签: pythonpandasnumpydataframedata-conversion

解决方案


1)我相信您可以将偏差列转换为 int。

假设您有一个名为 df 的数据框,其列偏差。

你可以这样做:

df['bias'] = df['bias'].astype(int)

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.astype.html

2)对于事件编号,您可以执行以下操作:

df['incident_number'] = pd.to_datetime(df['incident_number'])

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.to_datetime.html

希望这可以帮助!


推荐阅读