首页 > 解决方案 > 预处理人名的最佳方法是什么?

问题描述

我有一个名称数据集,全名由三个名称组成,并标有性别。

我正在使用 Sklearn 来完成这项任务。我猜这不是一个编码问题,它是理论上的。在模型训练后,我将如何表示或预处理这些名称以预测其性别。我知道这项任务的许多方法,例如矢量化和嵌入,但我不确定它们是否最适合包含姓名和性别的数据。

由于我仍处于数据收集阶段,我无法显示我的工作有任何进展。

我正在尝试做的与本文中的内容相似:https ://arxiv.org/abs/2010.10852

感谢帮助,谢谢

标签: nlp

解决方案


推荐阅读