首页 > 解决方案 > 您可以通过 sklearn 中的特定列吗?

问题描述

我有一个相当大的 datframe(300 列),我正在使用 sklearn 来编码/缩放一些字段,我喜欢我可以选择我想要的特定列,然后删除其余的列。我的问题是,现在我的大数据框中的两列中有两个 numpy 数组,我想通过这些数组,而我未在 sklearn 管道中列出的其他数组被删除。

例如:

from sklearn.preprocessing import LabelEncoder, OneHotEncoder
from sklearn.compose import ColumnTransformer
ct = ColumnTransformer([("Country", OneHotEncoder(), [1])], remainder = 'passthrough')

这会将这个国家转变为 onehot 并通过一切。如果我有一个名为“numpy_array”的列怎么办,我怎样才能让那个只通过?

标签: pythonpandasscikit-learn

解决方案


如果我有一个名为“numpy_array”的列怎么办,我怎样才能让那个只通过?

from sklearn.compose import ColumnTransformer

ct = ColumnTransformer(
    transformers=[
        ('np_array_transform', 'passthrough', ['numpy_array']),
    ],
    remainder='drop',
)

推荐阅读