首页 > 解决方案 > 如何仅从该元素中提取 url?

问题描述

我应该使用什么 xpath 仅从以下元素中提取 url 链接?

<a class="url" rel="noreferrer" onclick="redirect('https://www.fotbollskanalen.se/allsvenskan/kujovic-siktar-pa-startplats-var-naturligt-att-agera-inhoppare---nu-vill-jag-s');">Läs mer på Fotbollskanalen</a>

我尝试使用下面的 xpath,但它只返回“Läs mer på Fotbollskanalen”,而不是 url 本身。

a[1]/child::node()

还尝试了尝试设置指定类但无法正确设置的不同版本。

标签: htmlxpathweb-scraping

解决方案


尝试这个:

substring-before(substring-after(//a/@onclick, "'"),"'")

它会,

  • substring-before(substring-after(foo, "'"),"'"): 获取 in 所包含的所有'内容foo
  • //a: 元素a。
  • /@onclick: 里面的属性onclick

推荐阅读