首页 > 解决方案 > scikit-learn CountVectorizer。词汇_

问题描述

我有以下示例:

sentences = ['Rashmi likes ice cream', 'Rashmi hates chocolate.']

vectorizer = CountVectorizer(min_df=0, lowercase=False)
vectorizer.fit(sentences)
vectorizer.vocabulary_

输出:

{'Rashmi': 0, 'likes': 5, 'ice': 4, 'cream': 2, 'hates': 3, 'chocolate': 1}

那么这些数字代表什么?我不明白。

标签: pythonscikit-learncountvectorizer

解决方案


这是从单词到它的ID的映射

当在向量上调用 fit 时,每个单词都将映射到字典中的值。


推荐阅读