首页 > 解决方案 > 如何通过在java中处理多个自由文本来预测动作

问题描述

我有一个多列数据集如下

Id      Summary        Component       Description      Labels             Action

id1     free-text-11   free-text-12    free-text-13     label1, label2     action1
id2     free-text-11   free-text-22    free-text-23     label2, label3     action2

... so on

这里的SummaryComponentDescription包含用户提供的英文自由文本。标签操作列包含系统定义的固定文本。现在我手头的工作是使用 java 训练一个模型,该模型将在从其他列(摘要组件描述标签)读取数据后预测Action值,这里一些列可以是可选的。

作为一个新手,我尝试使用 mallet 使用 LDA,但所有示例仅处理一个自由文本输入列,而且我不确定哪种算法最适合我的用例。那么如何使用java解决这个问题呢?任何帮助,将不胜感激。

标签: javamachine-learningnlpmallet

解决方案


推荐阅读