python - 如何使用 Pandas (.map) 进行标记?
问题描述
下表中带有熊猫 (.map) 的标签
m2m_similarity.columns = ['MoviId 1','MoviId 2','similarity_score']
m2m_similarity.head(3)
我试图让标签稍微相似、相似和完全
m2m_similarity['analysis'] = m2m_similarity['similarity_score'].map({
0.1: 'slightly-similar', 0.2: 'slightly-similar', 0.3: 'slightly-similar', 0.4: 'slightly-similar',
0.5: 'similar', 0.6: 'similar', 0.7: 'similar', 0.8: 'similar',0.9: 'similar',
1.0: 'Exacly'
})
m2m_similarity.head(3)
结果是楠
解决方案
更好的方法是:
m2m_similarity['analysis'] = m2m_similarity['similarity_score'].map(lambda s: 'Exacly' if round(s, 2) == 1 else ('similar' if round(s, 2) >= 0.5 else 'slightly-similar'))
因为它将涵盖两者之间的所有选项。无论如何,请确保similarity_score
您有 numbers 而不是strings
,如果它们实际上不是高精度浮点数,那么您只显示第一个数字。
推荐阅读
- javascript - 如何将参数从 React 组件传递给事件
- vuejs2 - Visual Studio 中的 Vuejs2 Web 项目 - 401 调用并且没有 iis express
- python - 如何将 Pandas 数据框插入 PostgreSQL 表?
- intellij-idea - 如何在 IntelliJ 中查看多个选项卡?
- bioinformatics - 为什么 minimap2 输出没有对齐数据的 sam 文件?
- sql - 无法执行 .sql 文件 - 错误 1064 (42000)
- javascript - “错误:已有具有此 ID 的源(匿名函数)”是什么意思?(反应,MapboxGL)
- r - 如何在 R 中将我的 excel 读取为字符串?(R 将我的 excel 文件读取为日期格式)
- ios - Testflight beta版调用扫描二维码应用剪辑体验
- python - 当附加到 Pandas DataFrame 中的字典中的列表时,它会附加到列中的所有字典而不是我指向的字典