python - 如何在多列上使用 OneHotEncoder 编码?
问题描述
我有一个形状为 (85,78) 的 DataFrame,每行对应于一个特定区域,其值作为不同的餐厅类别,如“面包店”、“咖啡馆”、“烧烤联合”等。总唯一类别 = 175。
我需要计算每个区域的顶级类别,为此我想对数据集进行编码。但是 OneHotEncoding 总共给了我 949 行而不是 175 个唯一行。似乎它正在为每一列做 fit_transform。
如果沿其他列重复,pd.get_dummies 通过为每个类别添加后缀 (0,1,2..etc) 来执行相同的操作。
我希望数据框只有 175 列,以便我可以根据每个区域计算它们的总和。
解决方案
推荐阅读
- c++ - 如何绑定 SOCI 查询的输出?
- kubernetes - 使用 operator-sdk 生成“oneOf”属性
- json - 使用 jq 处理大文件时提高性能
- c++ - constexpr 构造函数需要常量成员函数的问题
- python - 使用 if 语句来了解用户是否创建了帖子
- c++ - 令牌“,”之前的预期主表达式
- html - HTML/CSS ; 我如何制作这个导航栏(水蓝色的?左边是 .png 格式的标志,它是如何突出背景的?
- python - 将单元格的每个单词转换为新行
- javascript - 如何在0和1的矩阵中找到两个随机点之间的路径
- python - 绘制水平条形图,给出意想不到的结果