首页 > 解决方案 > Word2Vec 和类似的:当您的数据分布不是对数对数线性时,是否可以使用 zipf 概率进行负采样?

问题描述

我有不遵循类似 zipf 分布的经验数据,这意味着秩和频率之间的频率表的简单对数图远不接近线性。我仍在尝试使用这些数据开发嵌入。使用 Keras 的 tf.keras.preprocessing.sequence.make_sampling_table 之类的东西进行负采样有什么问题吗?

标签: pythonkerasstatisticssamplingzipf

解决方案


推荐阅读