首页 > 解决方案 > 在没有机器学习库的情况下,在 Python 中开发一个朴素贝叶斯分类器作为电子邮件过滤器

问题描述

我拥有的数据集是(“wordsList.csv”和“classList.csv”)

wordsList 文件包含 72 封预处理的电子邮件。每行都是从每封电子邮件中提取的单词列表。

classList 文件包含指示电子邮件是普通邮件还是广告邮件的类标签(0 表示普通邮件,1 表示广告)。

我的任务是开发一个朴素贝叶斯分类器作为 Python 中的电子邮件过滤器。即,分类器预测电子邮件是普通邮件还是广告。

朴素贝叶斯分类器必须考虑单词的多次出现并实施技术来克服数字下溢和零计数。

但坏消息是我不能使用任何机器学习库,只允许使用 sciPy 和 NumPy,有什么方法可以实现吗?如果是这样,是否有任何从头开始实现此方法的示例代码?先感谢您!

单词列表表 类列表表

标签: pythonnaivebayes

解决方案


推荐阅读