首页 > 解决方案 > 如何将文件加载到每个工作人员?

问题描述

我正在寻找一种方法来分发一个巨大的文件(8gb,即 word2vec 预训练嵌入)以供每个工作人员使用。

事实上,我有一个程序来计算每个文档的嵌入作为其词向量的总和。每个词都有一个向量。

无论如何,每个工人都可以下载这个文件吗?

它与以下内容完全相同:如何在每个执行程序中加载一次文件? 问候

标签: apache-sparkpyspark

解决方案


推荐阅读