首页 > 解决方案 > 如何将数字列表作为单个特征传递给神经网络?

问题描述

我试图通过对从 fasttext 模型中提取的句子嵌入进行聚类来对句子进行聚类。每个句子嵌入有 300 个维度,我想将它们减少到 50 个(比如说)。我尝试了 t-SNE、PCA、UMAP。我想看看自动编码器如何处理我的数据。

现在将每个句子的 300 个数字作为单独的特征传递给 NN 是有意义的,还是应该将它们作为单个实体传递?如果是这样,有没有办法将列表作为特征传递给 NN?

我尝试将 300 个数字作为单独的特征传递,并尝试对输出进行聚类。可以得到非常少的有意义的集群,其余的要么是噪音,要么是没有相似句子但被分组的集群(但使用 UMAP 等其他技术,我可以获得更多数量的更有意义的集群)。任何线索都会有所帮助。提前致谢 :)

标签: tensorflowmachine-learningkerasneural-networkpytorch

解决方案


推荐阅读