python - 数据类型转换问题
问题描述
[ https://github.com/rgrantham82/Hate_Crimes_Analysis/blob/master/Data%20Wrangling%20(1).ipynb]
如果上述链接不起作用,请使用 [ https://github.com/rgrantham82/Hate_Crimes_Analysis]并单击 Data Wrangling Jupyter notebook。
我目前正在分析德克萨斯州奥斯汀的仇恨犯罪数据。到目前为止,我正处于它的清洁阶段,我对如何最好地进行脑放屁。
到目前为止,我连接了来自 data.austintexas.gov 的 4 个数据集——报告了从 2017 年至今的仇恨犯罪。结果集产生了几个新列,因为原始数据列,尤其是“日期...”、“受害者...”和“犯罪者...”列的格式都由创建者/策展人不同(s)......无论你为 austintexas.gov 工作的人都做得很好......无论如何,我现在的目标是:
对我而言,最重要的列是“偏差”列。如何将数据转换为数值类型?我无法用 Matplotlib bc 可视化它,显然它不是数字的。
以某种方式将“事件编号”数据转换为日期时间。或其他一些数值数据类型,以使可视化更好。
除非可以清理和合并各种“日期”列并转换它们,但最简单的方法似乎是操纵“事件编号”列。
顺便说一句,我是 Python 的新手。非常感谢任何帮助,但我也非常愿意接受建议等。谢谢大家!
解决方案
1)我相信您可以将偏差列转换为 int。
假设您有一个名为 df 的数据框,其列偏差。
你可以这样做:
df['bias'] = df['bias'].astype(int)
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.astype.html
2)对于事件编号,您可以执行以下操作:
df['incident_number'] = pd.to_datetime(df['incident_number'])
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.to_datetime.html
希望这可以帮助!
推荐阅读
- javascript - 尝试使用现有对象中的 jsonata 创建对象
- python-sockets - TypeError: socket.bind() 只接受一个参数(给定 2 个)
- typescript - 有条件地在打字稿中获取接口属性的类型
- python - 如何在 Python Pandas 的一个数据框中使用几列进行合并?
- kotlin - 在 Business Central 中限制通过 API 调用获取的记录数
- python - 到选定节点的总体最短路径
- javascript - 在 div 内的每个链接旁边添加一个下拉菜单
- arrays - 分配 6 个唯一随机数数组时的问题
- flutter - 如何在颤振中自动修复一些小问题,主要是空检查
- flutter - 为什么在 AppLifecycleState.inactive 状态下,widget 不是每次都重绘?