dataframe - 有什么方法可以在 Julia DataFrames 中快速收集分类特征?
问题描述
我将 Julia 0.6.3 与 Dataframes.jl 一起使用
我想知道是否有任何方法可以在 Julia 中轻松获得分类特征?
对于大型数据集,不可能手动输入所有内容。
我的解决方法是依赖字符串,通常是低基数,但这并不是万无一失的。
到目前为止我的解决方法:
cat_cols = []
for col in cols
if contains(string(typeof(X_train[col])),"String") == true
push!(cat_cols,col)
end
end
但这似乎有点难看,我没有捕捉到标签编码的值,因为它们是整数。
我也可以尝试依赖低唯一计数,但也会考虑稀疏特征。
任何的想法?谢谢!
解决方案
推荐阅读
- javascript - 使用过滤器和减少JS
- c++ - 它说我需要的分号应该去哪里?
- nginx - NGINX反向代理未加载所有图像主页
- protocol-buffers - 您如何看待可选作为 protobuf 字段名称的前缀?
- python - 如何使用 `requests.Session` 对给定 URL 的请求进行速率限制
- .htaccess - 使用 HTACCESS 重写 URL 以获得多语言支持
- reactjs - React axios 获取返回空数组
- python-3.x - 使用 python 3.6 的图像到 osd tesseract 错误
- java - Alam Manager 并非一直在工作
- python - ubuntu中的Harvester安装错误