首页 > 解决方案 > 如何使用 API 从 Wikipedia 获取表格数据

问题描述

我应该如何构造我的查询以从https://en.wikipedia.org/wiki/Michael_Bisping的混合武术记录部分中的(第一个)表中获取数据?理想情况下,我想以 json 格式获取表格数据,但 HTML 也可以。

我试过这个查询来获取页面的部分:https ://en.wikipedia.org/w/api.php?action=parse&prop=sections&page=Michael_Bisping

结果告诉我该表在索引为 12 的部分中。我不知道接下来应该运行什么查询。

标签: apiwikipedia

解决方案


使用API Sandbox生成一个 url!

设置actionparse

PageMichael Bisping

Section12(综合格斗记录)

最终网址:

https://en.wikipedia.org/wiki/Special:ApiSandbox#action=parse&format=json&page=Michael%20Bisping&prop=text&section=12&callback=


我用prop=extractswithaction=query来获得解析结果:

https://en.wikipedia.org/w/api.php?action=query&format=json&titles=Michael%20Bisping&prop=extracts

但是,这个请求是不可能的(?)section=12,也许还有另一种方法来处理结果


推荐阅读