首页 > 解决方案 > 如何从 NY Times API 访问特定日期的每篇文章?

问题描述

我已经访问了 NYT API。

我最初使用 http 调用: https://api.nytimes.com/svc/search/v2/articlesearch.json?fq=source:("The New York Times")AND pub_date:("2019-04-04")&api-key=<MY KEY HERE>.

这让我得到了这个部分的 json:

"meta": {
      "hits": 176,
      "offset": 0,
      "time": 8
    }

然后,我通过以下调用循环浏览每个点击或页面https://api.nytimes.com/svc/search/v2/articlesearch.json?fq=source:("The New York Times")AND pub_date:("2019-04-04") AND page=<EACH NUMBER> &api-key=<MY KEY HERE>

然而,当我应该得到 150 多篇文章时,我只得到了 70 篇文章。我在通话中做错了什么?

标签: jsonapiweb-scraping

解决方案


如果您将 API 调用更改为以下内容,这将起作用:

articlesearch.json?fq=source:"The New York Times"&sort=newest&begin_date=20190404&end_date=20190404&page=0
...
articlesearch.json?fq=source:"The New York Times"&sort=newest&begin_date=20190404&end_date=20190404&page=21

推荐阅读