首页 > 解决方案 > 寻找数据集:关于新闻文章的元数据,跨越 15 年以上

问题描述

有谁知道包含有关新闻文章的元数据的数据集?

基本数据集要求:

  1. 100k+ 篇新闻文章
  2. 涵盖 5 种以上的出版物
  3. 跨越 15 年以上的文章
  4. 每篇文章的元数据,作者姓名+出版年份
  5. 必须合法获取(没有违反 TOS 的抓取数据)

我浏览了许多潜在的来源。这里有些例子:

标签: databasedataset

解决方案


推荐阅读