nlp - 如何使用 NLP 对下面的数据进行聚类?
问题描述
我的数据看起来像这样。我想使用 NLP 进行清理、矢量化和聚类。我应该如何处理这个问题?我对 NLP 很陌生
(1113, '10% Off Your Purchase'),
(1114, '20% Off Juice (Limit 3)'),
(1120, 'BOGO Sandwich / Bagel'),
(1138, '$5 Off $15 or More'),
(1145, 'free 15mL bottle of juice'),
(1146, 'free 15mL bottle of juice'),
(1148, "10% Off (can't combine)"),
(1158, '10% Off or 20% Off Liquid'),
(1159, 'Free Vape Gift'),
(1165, '20% Off Any Single Item'),
(1166, '10% Off Any Single Item'),```
解决方案
您可以生成词向量并应用聚类算法对数据进行聚类。词向量擅长识别数据的上下文敏感性。
推荐阅读
- linux - 从 SMIL 文件中提取 jpeg
- r - 用列表替换列表中的项目
- c - 父进程只从其子进程中收到一次或两次 SIGCHLD,不管它 fork() 多少次
- mysql - 具有动态连接的联合表
- asp.net-core-middleware - .Net Core 2.1 自定义中间件问题与身份验证
- active-directory - 本地活动目录使用 API 创建/删除用户
- html - 如何让rails图像标签垂直显示
- javascript - 无法将文件上传到服务器页面
- ruby-on-rails - docker-compose rails 未绑定端口 80
- google-chrome - Nginx 反向代理 405 PUT Chrome