python - 是否有将字符串转换为数字并返回用于机器学习的功能
问题描述
我在熊猫数据框中有很多字符串,我想为每个字符串分配一个用于 keras 的数字。
字符串代表一个位置:
CwmyNiVcURtyAf+o/6wbAg==
我想把它变成一个数字然后再回来。我正在使用 keras、tensorflow 和 pandas。其中一个模块是否包含执行此操作的功能?还是我必须写一个哈希表?
像这样:
CwmyNiVcURtyAf+o/6wbAg==
=> 1
CwmyUSVcbBtiBQEkAN4bVbA=
=> 2
CwmypSVdCRNYBv4MAFUTSRY=
=> 3
CwnBoiVCjRNPBAAJ/ysTHw==
=> 4
CwnBoiVCjRNfBv5QAEITCA==
=> 5
CwmyUSVcbBtiBQEkAN4bVbA=
=> 2
我有大约 8000 个位置,每个位置在 Dataframe 中是 15 次
解决方案
您应该考虑使用 one-hot 编码,这可以通过get_dummies
函数使用 pandas 轻松完成。这将为每个“类别”(即唯一字符串)创建二进制列。
推荐阅读
- keras - 在训练之前用一些权重实例化 Keras 模型
- reactjs - 来自服务的 ReactJS 导航
- bash - 在 Curl 中使用 bash 生成随机 IP
- linux - docker container: curl: (7) 无法连接到 172.17.0.1 端口 4000: 没有到主机的路由
- javascript - 我正在获取 objectHTMLimageElement 而不是列表项中的图像
- php - 使用列表基于逗号分隔值
- c - C 仅用于打印最后一个索引输入
- c# - 如何使用 AutoMapper 映射两个对象集合
- android - 比较 ZonedDatetime 以删除 SQLite 中的记录?
- node.js - 在 CRA 反应应用程序中获取“在树的较高位置检测到不同版本的 webpack”错误