首页 > 解决方案 > 有什么方法可以在 Julia DataFrames 中快速收集分类特征?

问题描述

我将 Julia 0.6.3 与 Dataframes.jl 一起使用

我想知道是否有任何方法可以在 Julia 中轻松获得分类特征?

对于大型数据集,不可能手动输入所有内容。

我的解决方法是依赖字符串,通常是低基数,但这并不是万无一失的。

到目前为止我的解决方法:

cat_cols = []
for col in cols
    if contains(string(typeof(X_train[col])),"String") == true
        push!(cat_cols,col)
    end
end

但这似乎有点难看,我没有捕捉到标签编码的值,因为它们是整数。

我也可以尝试依赖低唯一计数,但也会考虑稀疏特征。

任何的想法?谢谢!

标签: dataframejuliacategorical-data

解决方案



推荐阅读