python - 如何规范化 Pandas 中一列是分类的数据范围?
问题描述
我一直在尝试预处理一组数据,但由于其中一个列具有分类值,我无法获得正确的值。
执行标准化后,我得到了教育学位类别的值。 归一化结果
有没有更好的选择来处理这个问题或任何替代方案来使结果更好?
解决方案
只需创建一个必须从数据框中标准化的列列表。
cols = ['A','B']
for col in cols:
df[col] = (df[col]-df[col].min())/(df[col].max()-df[col].min())
推荐阅读
- vba - Web 抓取调试打印 LocationURL 返回意外值
- typescript - 如何在 Vue 3 中添加对全局组件的类型支持?
- javascript - 如何在 VS Code 中启用 mjs 文件的类型检查
- selenium - 探索向希望自行运行测试的非技术业务团队提供 Selenium 测试的选项
- git - 致命:无法访问“https://xxxx.git/”:服务器证书验证失败。CAfile:/etc/ssl/certs/ca-certificates.crt CRLfile:无
- python - 为什么 siunitx LaTeX 包会为 matplotlib 图形中的某些文本元素添加垂直偏移量?
- java - 通过 C# 和 Java 之间的 protobuf-net 进行序列化/解封
- firebase - Firebase如何检查路径包含值并允许读写其他路径
- javascript - 无效的 VNode 类型:未定义(未定义) - 与
- google-api - updateMask 可能仅包含“draftGrade”或“assignedGrade”在通过 Google 课堂 API 修补学生提交时出现 400 错误