javascript - 从存储在数组中的 HTML 中提取链接
问题描述
我正在尝试从以下 html 中提取链接。数组中有很多像这样的 HTML。
推文[0] 是:
var tweets = Array.from(document.querySelectorAll("[class ^= AdaptiveMedia-ph]"));
console.log(tweets);
<div class="AdaptiveMedia-photoContainer js-adaptive-photo " data-image-url="https://pbs.twimg.com/media/DfFmgY6WAAAh0sG.jpg" data-element-context="platform_photo_card" style="background-color:rgba(51,64,18,1.0);" data-dominant-color="[51,64,18]">
<img data-aria-label-part="" src="https://pbs.twimg.com/media/DfFmgY6WAAAh0sG.jpg" alt="A tree" style="width: 100%; top: -0px;">
</div>
如何从 HTML 文本中实际提取“src”中的链接和“alt”中的 alt 文本?提前致谢!
解决方案
像这样:
var tweets = document.querySelectorAll("[class ^= AdaptiveMedia-ph]");
for (var i=0;i<tweets.length;i++) {
console.log("data-image-url",tweets[i].getAttribute("data-image-url"));
var img = tweets[i].querySelector("img");
console.log("image-url",img.src,"alt",img.alt);
}
<div class="AdaptiveMedia-photoContainer js-adaptive-photo " data-image-url="https://pbs.twimg.com/media/DfFmgY6WAAAh0sG.jpg" data-element-context="platform_photo_card" style="background-color:rgba(51,64,18,1.0);" data-dominant-color="[51,64,18]">
<img data-aria-label-part="" src="https://pbs.twimg.com/media/DfFmgY6WAAAh0sG.jpg" alt="A tree" style="width: 100%; top: -0px;">
</div>
推荐阅读
- django - Recaptcha v3 是否需要后端实现?
- codenameone - EncodedImage create(String i) 解释
- node.js - AWS ECS nodejs 应用程序使用 Logspout 将日志级别传播到 PaperTrail
- python - 尝试写入 BigQuery 时,Apache Beam 中没有属性“TableReference”
- macros - 正确编写具有命名符号的宏
- python - python中的咳嗽识别
- angular - 根据表单中的选择更改占位符
- python - TypeError:将一个函数传递给另一个函数时,“函数”对象不可下标
- stored-procedures - 如何将 VARCHAR2 的 TYPE VARRAY 参数列表传递给 PL-SQL 存储过程并在循环中访问参数列表
- python - 如何告诉python传递给函数的意外变量类型在上下文中是正确的