python - 使用朴素贝叶斯获取 TF/Count 向量
问题描述
我正在使用 Python 3.7(Windows,64 位)。虽然我可以获得 TF-IDF 结果,但之后我无法获得 TF/Count 向量。这是我获得 TF-IDF 结果的示例代码,
DOC, LBL = read_corpus()
# Splits the dataset into training (75%) and test set(25%)
split_point = int(0.75*len(DOC))
trainDoc = DOC[:split_point]
trainClass = LBL[:split_point]
testDoc = DOC[split_point:]
testClass = LBL[split_point:]
# Calling the classifier (use the tf-idf/count feature/vectorizer)
Multinomial_Naive_Bayes(trainDoc, trainClass, testDoc, testClass, tfIdf=True)
解决方案
做了一些谷歌搜索后,我找不到任何库包含Multinomial_Naive_Bayes()
方法。
Multinomial_Naive_Bayes()
您可能需要编辑您的问题并在此处粘贴您自己的方法read_corpus()
。
但是如果你使用scikit-learn,你可以这样做:
vectorizer = CountVectorizer()
transformer = TfidfTransformer()
word_freq_matrix = vectorizer.fit_transform(corpus)
tfidf_result = transformer.fit_transform(word_freq_matrix)
推荐阅读
- javascript - 当我尝试以编程方式发送 SIGTERM 信号时,NodeJS process.kill 似乎在 Windows 上不起作用
- blazor - 在托管的 Blazor Web Assembly ASP.NET Core 中读取 wwwroot 中的文件
- react-native - Mapbox 支持 Flutter 和 React Native 吗?应用程序
- javascript - 获取下一个表格单元格onclick javascript的值
- reactjs - 用函数反应函数组件
- model-view-controller - 无法将 lambda 表达式转换为 ienumerable 类型,因为它不是 kendo grid mvc 中的委托类型
- wpf - 无论是绑定 Byte[] 还是字符串以获得良好的性能,哪种绑定对 Image 更好
- javascript - React native:从 1 个函数中获取数据并将其传递给 2 号函数的方法是什么?
- javascript - 如何将全局样式表导入组件 vue?
- appium - 如何修复 Appium 和 Python 的失败“INSTALL PARSE FAILED NO CERTIFICATES”?