首页 > 解决方案 > gensim 的 fasttext 的默认设置是什么?

问题描述

我在这里找不到有关 gensim fasttext 参数的默认值的任何信息

还是它们与原始的 Facebook fasttext 实现相同?

标签: gensimfasttext

解决方案


您问题中的链接https://radimrehurek.com/gensim/models/fasttext.html#gensim.models.fasttext.FastText在那里显示了所有默认值。摘录在这里:

class gensim.models.fasttext.FastText(sentences=None, corpus_file=None, 
    sg=0, hs=0, size=100, alpha=0.025, window=5, min_count=5, 
    max_vocab_size=None, word_ngrams=1, sample=0.001, seed=1, workers=3, 
    min_alpha=0.0001, negative=5, ns_exponent=0.75, cbow_mean=1, 
    hashfxn=<built-in function hash>, iter=5, null_word=0, min_n=3, 
    max_n=6, sorted_vocab=1, bucket=2000000, trim_rule=None, 
    batch_words=10000, callbacks=(), compatible_hash=True)

那些与 Facebook 原生 FastText 对应的参数可能应该具有相同的默认值,但可能有些略有不同以匹配其他 gensim 类中的类似参数。因此,如果您指望使用相同的默认值进行某些分析,您应该对照 Facebook 文档检查这些值。


推荐阅读