python-3.x - 根据列的实际值从对象转换熊猫数据框列类型
问题描述
我使用下面的代码将 spark 数据帧转换为 pandas 数据帧。
trainDF=df.toPandas()
其中 df 是 spark 数据帧, trainDF 是 pandas 数据帧。
但问题是,熊猫数据框中每一列的所有数据类型都变成了对象。
44640 non-null object
44640 non-null object
44640 non-null object
44640 non-null object
44640 non-null object
1440 non-null object
44640 non-null object
44640 non-null object
44640 non-null object
44640 non-null object
44640 non-null object
尝试使用推断对象函数转换为实际数据类型,仍然没有运气。
trainDF=trainDF.infer_objects()
有什么方法可以根据列的实际内容更改数据类型。
解决方案
推荐阅读
- python - VS 代码运行前一个文件而不是当前文件
- c# - 拆分成数组后修改每个字符串
- javascript - Material UI 的 Select 组件的值类型
- jenkins - Jenkins Pipeline 抛出 ProxyException “预期调用 Device.
但最终抓住了 Device.getIP” - mysql - 谁能帮我弄清楚我在这里犯了什么语法罪行?
- javascript - 在 SPA React 应用程序中使用 setInterval 和递归 setTimeout 不会导致内存泄漏
- arrays - 如何在 Jest/React 中简单地对返回 li 元素数组的函数进行单元测试
- django - 如何从 Import-Export(管理员集成)Django 中选择导入?
- python - 我如何使用 Tesseract OCR 识别 2 行车牌
- jenkins - 失败与“
不是 ModelObject 的实例。”在 Jenkins 上