首页 > 解决方案 > 在生成器=链接中识别来源

问题描述

以下调用扫描 en.wikipedia.org 上的两个页面并返回从这些页面链接的页面:

https://en.wikipedia.org/w/api.php?format=json&formatversion=2&errorformat=plaintext&action=query&generator=links&gplnamespace=%2A&gpllimit=max&titles=Mannequin%7CResuscitation

但我无法确定哪些链接出现在哪个页面上。例如,页面上nuclear tests存在指向的链接Mannequin,但在上面的输出中没有指出。我想在输出中包含这些信息。

这可以做到吗?

标签: mediawikiwikipediawikipedia-apimediawiki-api

解决方案


大多数生成器不提供任何关于生成页面的信息。(有关相关讨论,请参阅https://phabricator.wikimedia.org/T263841。)您必须将其转换为非生成器查询。在您的具体示例中,您实际上并没有利用它作为生成器,所以这很容易做到: https ://en.wikipedia.org/w/api.php?format=json&formatversion=2&errorformat=plaintext&action=query&prop= links&plnamespace=%2A&pllimit=max&titles=Mannequin%7CResuscitation 在其他情况下,不使用生成器可能意味着您需要进行一些额外的查询。


推荐阅读