首页 > 解决方案 > XPATH 结果为空字符串

问题描述

url <- read_html('https://ngodarpan.gov.in/index.php/home/statewise_ngo_sof/27/35/1?')
valuation <- html_nodes(url,xpath='//*[(@id = "ngo_state_p")]')
valuation
class(valuation)
valuation1 <- html_text(valuation)
valuation1

上面代码的结果是空字符串?有没有办法得到确切的值。ngodarpan.gov.in/index.php/home/statewise_ngo/62/35/1 单击第一个非政府组织 AdityaNatyaAcademy 的名称,在该弹出窗口下检查注册状态的值,即 ANDAMAN & NICOBAR ISLANDS

标签: javahtmlweb-scrapingrvest

解决方案


您的个人 NGO 数据在后台以 ajax 请求的形式出现。下面是获取数据的 javascript 代码。

功能:(function show_ngo_info(ngo_id)在同一页面...)

$.post("https://ngodarpan.gov.in/index.php/ajaxcontroller/show_ngo_info", {
         id: ngo_id,
         csrf_test_name:get_csrf_token()
        }

它使用 csrf 令牌,这可能会使您的自动化稍微复杂化。但是,您仍然应该能够使用它来检索数据。让我知道事情的后续。

数据是在后台点击非政府组织链接获取的,因此在此之前尝试读取数据时会得到空字符串。


推荐阅读