首页 > 解决方案 > 熊猫 to_numeric 不投射空数据帧

问题描述

我需要一个包含所有 dtypes 子集的数据框np.number。to_numeric 函数允许我对包含一些数据的数据帧执行此操作。作为一个极端情况,我用一个空的数据框测试它,它似乎不起作用。

import numpy as np
import pandas as pd

df = pd.DataFrame(columns=['col1', 'col2', 'col3'])
df = df.apply(pd.to_numeric, errors='coerce')
print(df.dtypes)

给我输出

col1   object
col2   object
col3   object
dtype: object

我期望的地方

col1   int64
col2   int64
col3   int64
dtype: object

如果我填充数据框,那么问题就会消失:

df = pd.DataFrame({'col1': [1, 2], 'col2': [1, 2], 'col3': [1, 2]})
df = df.apply(pd.to_numeric, errors='coerce')
print(df.dtypes)

给了我预期的输出。

有人可以解释这种不同的行为,并提出解决方法。除非需要,否则我不想明确检查数据框是否有数据。

我正在使用python 3.6.1

标签: pythonpython-3.xpandas

解决方案


使用astype似乎可以实现

df=df.astype("int64")

您还可以为每一列显式分配类型

df = pd.DataFrame({'col1':pd.Series([], dtype='int'),
               'col2':pd.Series([], dtype='int'),
               'col3':pd.Series([], dtype='int')})

print(df.dtypes)

col1    int64
col2    int64
col3    int64
dtype: object

推荐阅读