首页 > 解决方案 > 如何使用 Pandas (.map) 进行标记?

问题描述

下表中带有熊猫 (.map) 的标签

m2m_similarity.columns = ['MoviId 1','MoviId 2','similarity_score']
m2m_similarity.head(3)

我试图让标签稍微相似、相似和完全

m2m_similarity['analysis'] = m2m_similarity['similarity_score'].map({
    0.1: 'slightly-similar', 0.2: 'slightly-similar', 0.3: 'slightly-similar', 0.4: 'slightly-similar',
    0.5: 'similar', 0.6: 'similar', 0.7: 'similar', 0.8: 'similar',0.9: 'similar', 
    1.0: 'Exacly'
})
m2m_similarity.head(3)

结果是楠

在此处输入图像描述

在此处输入图像描述

标签: pythonpandasjupyter-notebookdata-science

解决方案


更好的方法是:

m2m_similarity['analysis'] = m2m_similarity['similarity_score'].map(lambda s: 'Exacly' if round(s, 2) == 1 else ('similar' if round(s, 2) >= 0.5 else 'slightly-similar'))

因为它将涵盖两者之间的所有选项。无论如何,请确保similarity_score您有 numbers 而不是strings,如果它们实际上不是高精度浮点数,那么您只显示第一个数字。


推荐阅读