python-3.x - Python:尝试将单列从 Float 转换为 Int
问题描述
Python 新手。在 PythonAnywhere 中使用大型数据集。出于某种原因,我的 CSV 将“年份”作为文本引入。我能够使用 pd.to_numeric 将其设为数字。但现在它是一个浮点数,我想要一个整数。我尝试了 .dropna().apply(np.int64) 但它仍然以 int 形式出现。我需要 dropna,因为显然有一些缺失值代码:
import pandas as pd
import numpy as np
movies_df = pd.read_csv("movies_All.csv")
recentdf = movies_df.copy()
recentdf['Year'] = pd.to_numeric(recentdf['Year'], errors = 'coerce')
recentdf['Year'] = recentdf['Year'].dropna().apply(np.int64)
#recentdf = recentdf[recentdf['Year'] > 2000]
print(recentdf['Year'].head())
输出:名称:年份,dtype:float64
解决方案
我不确定您的示例数据是什么样的,但请尝试使用
“.astype(int)”而不是“.apply(np.int64)”
这是因为 pandas 数据框对象由 numpy 数组组成。因此,这个 numpy 转换应该适用于您的操作。
可以在此处找到有关此操作的文档。
推荐阅读
- firebase - 我从 github 克隆了一个项目,运行它后我遇到了这些错误
- azure - 无法使用 Postman 从 Azure Devops rest API 下载附件
- c# - ServicePointManager.ServerCertificateValidationCallback 是否覆盖 .Net 中的现有证书验证?
- java - 使用@TestConfiguration 注释的配置类如何也覆盖属性?
- android - 修改器取决于 Jetpack Compose 中其他修改器的值?
- java - 在 docker 中从 pom.xml 安装 maven 依赖项
- swift - frame.minX 在多台显示器上没有给出正确的结果
- javascript - React JS:如何将变量从一个文件传递到另一个文件,该文件不是同一文件的父文件或子文件?
- database - 如何在 Kubernetes 中处理来自多个 Pod 的并发事务
- store - Svelte 订阅多个存储值