首页 > 解决方案 > 根据列的实际值从对象转换熊猫数据框列类型

问题描述

我使用下面的代码将 spark 数据帧转换为 pandas 数据帧。

trainDF=df.toPandas()

其中 df 是 spark 数据帧, trainDF 是 pandas 数据帧。

但问题是,熊猫数据框中每一列的所有数据类型都变成了对象。

44640 non-null object
44640 non-null object
44640 non-null object
44640 non-null object
44640 non-null object
1440 non-null object
44640 non-null object
44640 non-null object
44640 non-null object
44640 non-null object
44640 non-null object

尝试使用推断对象函数转换为实际数据类型,仍然没有运气。

trainDF=trainDF.infer_objects()

有什么方法可以根据列的实际内容更改数据类型。

标签: python-3.xpandaspyspark

解决方案


推荐阅读