tensorflow - 如何将数字列表作为单个特征传递给神经网络?
问题描述
我试图通过对从 fasttext 模型中提取的句子嵌入进行聚类来对句子进行聚类。每个句子嵌入有 300 个维度,我想将它们减少到 50 个(比如说)。我尝试了 t-SNE、PCA、UMAP。我想看看自动编码器如何处理我的数据。
现在将每个句子的 300 个数字作为单独的特征传递给 NN 是有意义的,还是应该将它们作为单个实体传递?如果是这样,有没有办法将列表作为特征传递给 NN?
我尝试将 300 个数字作为单独的特征传递,并尝试对输出进行聚类。可以得到非常少的有意义的集群,其余的要么是噪音,要么是没有相似句子但被分组的集群(但使用 UMAP 等其他技术,我可以获得更多数量的更有意义的集群)。任何线索都会有所帮助。提前致谢 :)
解决方案
推荐阅读
- node.js - 如何安排 node.js 代码每天在调度程序中给定的时间之外的特定时间运行?
- javascript - 在当前对象中获取先前对象的值
- docker - Node 的清单列表条目中没有匹配的未知清单
- azure - 将 Azure 持久功能从 1.6.2 升级到 1.7.0 Nodejs
- android - YouTube 视频不会在 android studio 中的标签活动上停止
- node.js - 无法在本地安装“npm install -g yo”全局。
- powershell - cURL to PowerShell - 包含多个项目的哈希表
- c++ - Xcode - Clang 错误:未找到架构 x86_64 clang 的符号:错误:链接器命令失败,退出代码为 1(使用 -v 查看调用)
- node.js - 使用存储在 mongo 数据库节点和 express 中的凭据登录用户
- r - 无法在 Windows 上安装 [R] 包 KernSmooth - 错误:包“KernSmooth”不可用(适用于 R 版本 3.5.1)