首页 > 解决方案 > 是否有将字符串转换为数字并返回用于机器学习的功能

问题描述

我在熊猫数据框中有很多字符串,我想为每个字符串分配一个用于 keras 的数字。

字符串代表一个位置:

CwmyNiVcURtyAf+o/6wbAg==

我想把它变成一个数字然后再回来。我正在使用 keras、tensorflow 和 pandas。其中一个模块是否包含执行此操作的功能?还是我必须写一个哈希表?

像这样:

CwmyNiVcURtyAf+o/6wbAg===> 1

CwmyUSVcbBtiBQEkAN4bVbA==> 2

CwmypSVdCRNYBv4MAFUTSRY==> 3

CwnBoiVCjRNPBAAJ/ysTHw===> 4

CwnBoiVCjRNfBv5QAEITCA===> 5

CwmyUSVcbBtiBQEkAN4bVbA==> 2

我有大约 8000 个位置,每个位置在 Dataframe 中是 15 次

标签: pythonpandaskeras

解决方案


您应该考虑使用 one-hot 编码,这可以通过get_dummies函数使用 pandas 轻松完成。这将为每个“类别”(即唯一字符串)创建二进制列。


推荐阅读