python - 在没有机器学习库的情况下,在 Python 中开发一个朴素贝叶斯分类器作为电子邮件过滤器
问题描述
我拥有的数据集是(“wordsList.csv”和“classList.csv”)
wordsList 文件包含 72 封预处理的电子邮件。每行都是从每封电子邮件中提取的单词列表。
classList 文件包含指示电子邮件是普通邮件还是广告邮件的类标签(0 表示普通邮件,1 表示广告)。
我的任务是开发一个朴素贝叶斯分类器作为 Python 中的电子邮件过滤器。即,分类器预测电子邮件是普通邮件还是广告。
朴素贝叶斯分类器必须考虑单词的多次出现并实施技术来克服数字下溢和零计数。
但坏消息是我不能使用任何机器学习库,只允许使用 sciPy 和 NumPy,有什么方法可以实现吗?如果是这样,是否有任何从头开始实现此方法的示例代码?先感谢您!
解决方案
推荐阅读
- python - 如何在 Pandas 系列上使用带条件的 loc 函数?
- javascript - 在 React 中是否可以使用钩子来填充从 array.map() 生成的单个输入?
- reactjs - 将 SPA 转换为 SCORM 1.2 包
- node.js - Sequelize nodejs包含模型属性名称别名
- python - Python:在 pandas 中成功结合 str.contains 和 df.groupby
- java - 如何用 Python 为用 Java 编写的 gRPC 服务编写 gRPC 客户端
- git - 恢复特定的 git 提交和依赖于它们的所有后续提交
- mysql - MySQL ERROR 2026 - SSL 连接错误 - Ubuntu 20.04
- mysql - SQL - 从大型数据集中返回多条记录中的最新记录
- php - Laravel 避免子表中的重复条目