javascript - 加载任何 url 内容并在 JS 中遵循 XPATH
问题描述
我想做的是加载一个页面,并通过 XPath 或 Selector 或 JS Path 获取某些内容,然后在我的程序中使用由此获得的值。我怎么能那样做?例如在此页面上,使用页面的 url 并遵循该路径进行请求(同时也以某种方式定位类型,这里是类):
//*[@id="question-header"]/h1/a
会给我“加载任何 url 内容并在 JS 中遵循 XPATH”
当我得到里面的文字时:
<a href="/questions/54847748/load-any-url-content-and-follow-xpath-in-js" class="question-hyperlink">Load any url content and follow XPATH in JS</a>
解决方案
好吧,你可以使用类似的东西
document.getElementById('question-header').children[0].children[0].href;
它不像 XPATH(孩子的冗余)那样动态,但应该可以解决您面临静态结构的问题。对于 Node.js,有几个库也可以做到这一点,例如libxmljs
or parse5
-more on this here。
推荐阅读
- amazon-web-services - EROFS:一天后在 EBS 上运行 puppeteer 时的只读文件系统
- android - recycleview 只显示最后一行数据
- selenium-webdriver - 为什么我在使用 Command.GET 时收到“'str' object has no attribute 'execute'”错误?
- vue.js - 如何在不点击的情况下激活按钮
- c# - 如何检查列中的最新值并生成具有该特定值+1的新行?
- java - 从 xml 配置转换后,如何修复 Spring 3.2 java 配置中的 BeanCreationException?
- java - Scanner.hasNext() 方法说明
- elasticsearch - 如何在具有“脚本”和“文档”的 ES 上发出单个更新请求..?
- google-bigquery - BigQuery,按组中的条件获取行数数组
- javascript - 这是什么类型的日期格式以及如何将其格式化为人类可读的格式?