python - 对类似的错误消息进行分组 - NLP/机器学习 python
问题描述
我在一个 Excel 文件中有近 500 条错误消息,我正在尝试对类似的错误消息进行分组。以下是一些示例错误消息。
- 帐户名无效
- 帐号无效
- 关闭日期早于开放日期
- 结束日期早于有效日期
- 帐户名称必须是唯一的
- 帐号必须是唯一的
我的要求是将类似的错误消息分组(或)分类到组中。
到目前为止,我尝试的一种方法是在对文本进行预处理后使用 Doc2Vec 生成向量。但我不确定如何处理向量以及如何使用向量输出进行分组。
有人可以建议如何进一步进行吗?如果有其他更好的方法。请建议。
解决方案
推荐阅读
- python - Python 排序的 lambda 函数返回一个布尔值
- database - 如何为嵌套数据设计模式
- python - 比较两个列表中 str 之间的出现次数
- c - 带/不带功能的动态内存分配
- python - 排除列表中的元素
- javascript - 开玩笑:TypeError:axios.get.mockResolvedValue 不是函数
- c# - 在 Autofac C# Resolve 中,如何将参数传递给构造函数
- node.js - Firestore 导入数据文件未正确保存(ä、ö、ü、á 显示为符号)
- javascript - Firebase Scheduled Cloud Function 执行时如何获取时间?
- java - 由于缺少 JavaVM 框架,JavaCPP 在 Xcode 12.2 更新后在 macOS 上构建失败