首页 > 解决方案 > 如何确定网页的类别

问题描述

是否有任何开源项目或免费的可用资源可以在其中查询网页的类别类型(例如https://www.trustedsource.org/en/feedback/url)。我的数据集中有超过 200K 的网页。

标签: web

解决方案


在我看来,它更像是一个适合机器学习的分类问题。为此,您可以在流行的 ML 框架(例如 Keras/TensorFlow 和 PyTorch)中制作模型,或者在互联网上搜索可用的模型并使用您的数据集进行迁移学习。

我可以在 GitHub (链接) 上找到一个可以作为一个很好起点的项目。


推荐阅读