python - 使用映射将 DataFrame 从数字转换为字符串
问题描述
使用映射将数据帧从字符串转换为数字(作为 ID),以便我可以在机器学习作业之后将数值映射回字符串(这需要数值进行训练)
我的数据框中有 2 列:-
Repository Name
(需要转换的字符串)Number of Stars
(数值,因此无需执行任何操作)
我想将字符串转换为 ID,并且需要映射这些以在将来使用它。
注意:我的字符串是类似单词freecodecamp
而不是字符串中的整数值。
解决方案
def get_metadata(df, key, val):
#create a new column with index
df['index'] = df.index
if key == "Repository Name":
return {str(row[key]): row[val] for _, row in df.iterrows()}
else:
return {row[key]: row[val] for _, row in df.iterrows()}
emb2idx = get_metadata(dataframe, "index", "Repository Name")
您将获得索引(ID)的字典和您的字符串(存储库名称)以供将来映射。
推荐阅读
- f# - 将变量定义注入 F# 引用
- haskell - 为什么有一个用于 exceptT 的 MonadMask 实例?
- go - 有没有办法操纵延迟堆栈?
- ios - Flutter:未连接到 Android Studio 中的 IOS 模拟器
- c++ - 数组变量是 C++ 中的引用吗?
- asp.net - Web API 在控制器上未找到任何操作
- c++ - 修改 Makefile 以添加 GSL 库
- javascript - TypeError:无法读取未定义的属性“地图”(Google 地图放置自动完成 Angular 2)
- c++ - 函数无法解析
- angular - 按顺序发出 observables,直到第一次返回错误