首页 > 解决方案 > NLP初学者

问题描述

我有 excel 表,其中存在 3 列 x1、x2、x3。x1,x2 有问题,x3 连续有所有答案,我的意思是 x1 和 x2 第一行有问题,问题答案是 x3 第一列。x1 和 x2 混合了数字和文本数据,并且也有一些 NA 值。

在这里我的工作是我必须使用 NLP 技术来解决这些问题,如果我输入 x1 和 x2 问题,它将给出 x3 答案。所以这个问题没有给出完整的陈述,而是一些选定的词,如果我给出一些选定的关键字也将是答案。请指导我从哪里以及如何开始。请指导和建议

标签: machine-learningnlpcomputer-vision

解决方案


听起来(您的问题有点不清楚)您有一堆混合数据类型,并且您只想处理 x1 = some text1 + x2 = some text2 -> x3 = some answer text。我建议首先清理您的数据,您可以通过将您的数据管道到 PANDAS 数据帧中轻松删除 NA 或 NAN(我不确定您使用的是哪种语言)。如果您使用的是 python,您还可以使用 is.digit 函数轻松删除数字信息。我不完全确定您要做什么,所以我不能真正推荐清理数据后要做的事情。发布 2 个正确和不正确 x1、x2 和 x3 的示例可能会有所帮助。


推荐阅读