web - 如何确定网页的类别
问题描述
是否有任何开源项目或免费的可用资源可以在其中查询网页的类别类型(例如https://www.trustedsource.org/en/feedback/url)。我的数据集中有超过 200K 的网页。
解决方案
在我看来,它更像是一个适合机器学习的分类问题。为此,您可以在流行的 ML 框架(例如 Keras/TensorFlow 和 PyTorch)中制作模型,或者在互联网上搜索可用的模型并使用您的数据集进行迁移学习。
我可以在 GitHub (链接) 上找到一个可以作为一个很好起点的项目。
推荐阅读
- php - Laravel Eloquent 模型 hasMany 错误“Illuminate\Database\Eloquent\Relations\HasMany 无法转换为字符串”
- javascript - 将鼠标悬停在元素上时如何更改类?
- python - 使用 OpenCV 自动调整一张纸的彩色照片的对比度和亮度
- angular - angular anchor routerlink 动态链接地址
- arrays - ruby 中有没有像 object.in(array) 这样的东西?
- microsoft-graph-api - Outlook 联系人 ErrorQuotaExceeded
- javascript - 有没有办法在其页脚内显示从剑道中的日期选择器中选择的日期?
- regex - Kotlin 正则表达式线程安全
- python-2.7 - 如何使用 pymc 查找初始状态的变量以将最终状态与观察结果匹配?
- android - 如何改进库方法功能?