c# - 关于使用 ML.Net 识别名称的建议
问题描述
我无法从电话号码、电子邮件和姓名中匿名化许多医疗报告。我想我可以使用 regexp 列出电话号码和电子邮件(list 以验证它们是否可以留在报告中)。但是对于我需要 ML.Net 的名称。我猜我有大量(约 2000 年)包含姓名和一些不包含姓名的医疗报告。然后我创建一个由医疗文件和其中找到的名称组成的对(?)列表。然后我在对列表上训练网络。
我该如何看待这个?我发现的一切似乎都是关于对图片或更大的东西进行分类(也许我可以将文本设置为图像,并且某些模式会作为名称突出显示,但是我将如何获得它找到的名称?)或者它是某种树名称在某种分支中更频繁地出现在哪里?
我需要建议在哪里看,如何看它以及这种分类被称为什么。
提前致谢
解决方案
推荐阅读
- nlp - spaCy Doc.sents 未正确拆分
- python - Django密码重置问题
- flutter - 如何更新列表中的小部件
- c# - 如何知道图像在 OCR 之前是否颠倒?如果需要变换或校正方向,如何知道 90/180 变换是否正确?
- ruby-on-rails - 没有收到来自 Heroku Sendgrid 插件的邮件
- vim - 为什么在 vim 中 TODO 总是高亮显示?
- javascript - 使用 keyof 查找的 Typescript 界面模板
- plsql - SQL 循环按预期执行
- javascript - 使用 rangy 创建拖放
- c++ - C++ 得到 -243030403 和 \300\371 数字