nlp - 预处理人名的最佳方法是什么?
问题描述
我有一个名称数据集,全名由三个名称组成,并标有性别。
我正在使用 Sklearn 来完成这项任务。我猜这不是一个编码问题,它是理论上的。在模型训练后,我将如何表示或预处理这些名称以预测其性别。我知道这项任务的许多方法,例如矢量化和嵌入,但我不确定它们是否最适合包含姓名和性别的数据。
由于我仍处于数据收集阶段,我无法显示我的工作有任何进展。
我正在尝试做的与本文中的内容相似:https ://arxiv.org/abs/2010.10852
感谢帮助,谢谢
解决方案
推荐阅读
- sql - 使用限制的 Sequelize 分页需要 4 倍的时间来加载。我该如何优化?
- ms-word - Word - 删除 <> 之间的文本,包括表格
- python - Python 3 - 增强 writelines 函数以始终添加新行
- javascript - 调整引导警报的大小并将“x”保持在正确的位置
- tensorflow - 如何在tensorflow中实现自定义损失函数并进行梯度反向传播
- javascript - jQuery 如果每个 li == 0 内的每个输入值
- php - 如何使用源和目的地时间计算旅行时间?
- mysql - MySQL 为 JOINed 表中的每一行提供结果
- ios - Swift:从 AppDelegate 中的 UNTextInputNotificationAction 获取内容
- java - 尝试使用 TestNG 和 WebDriverManager 运行测试时出错