首页 > 解决方案 > 对类似的错误消息进行分组 - NLP/机器学习 python

问题描述

我在一个 Excel 文件中有近 500 条错误消息,我正在尝试对类似的错误消息进行分组。以下是一些示例错误消息。

  1. 帐户名无效
  2. 帐号无效
  3. 关闭日期早于开放日期
  4. 结束日期早于有效日期
  5. 帐户名称必须是唯一的
  6. 帐号必须是唯一的

我的要求是将类似的错误消息分组(或)分类到组中。

到目前为止,我尝试的一种方法是在对文本进行预处理后使用 Doc2Vec 生成向量。但我不确定如何处理向量以及如何使用向量输出进行分组。

有人可以建议如何进一步进行吗?如果有其他更好的方法。请建议。

标签: pythonnlpclassification

解决方案


推荐阅读