selenium - 自动提取 Youtube 广告 ID 的方法?
问题描述
我正在开发一个库以将 Youtube 广告存储在数据库中(基本上是出现的广告 id 以及它们出现的视频 id)。
我在这里找到了一个“手动”解决方案,例如:如何从 Youtube 下载视频广告? 但显然我想自动化它。现在我正在使用 Selenium 打开 youtube、打开随机视频等。
我发现,当我直接加载一个 url 时,有一个名为 ytInitialPlayerResponse 的 js 变量,我可以在其中通过解析找到初始广告,但由于某种原因,如果我的代码点击内部 url(试图“伪造”一个真正的 yt 访问者),然后在第一个 url 之后,该变量不再可用。
在花了几天时间调试所有可用的 js 变量、解析源代码、检查 ajax 调用之后......我决定在这里问一下,以防有人知道更好的解决方案。
有谁知道在任何时候提取出现在 Youtube 视频上的 youtube 视频广告的简单方法(使用自动化)?
谢谢大家,这个社区很摇滚!(并为我节省了无数时间和头痛):-)
解决方案
推荐阅读
- html - 在移动视图的表格行中换行长文本
- android - 如何使用谷歌登录制作apk?
- python - 如何将 UTC 日期时间转换为输出格式中的 T 和 Z?
- python - Python 将布尔变量输出到文件(读取、检查、写入)
- botframework - 瀑布步骤中的建议操作
- selenium - selenide.open 尝试抛出 NoSuchMethodError
- json - 尝试解码 json 时出错:simplejson.errors.JSONDecodeError:预期值:第 1 行第 1 列(字符 0)
- apache-kafka - 有没有办法为每个 kafka 主题获取所有制作人的 ip?
- python - 如何添加网格图作为一个图表的背景?
- django - 如何在 django 和 djangorestframework 中对创建 API 进行自定义验证?