python - (Python, Selenium Chromedriver) 循环遍历 txt 文件中的多个 url 以验证实时网页上的每个脚本标签
问题描述
我有一个 txt 文件,其中包含一个 URL 列表 (sitemap.txt),我想使用该列表来自动化一个脚本,该脚本通过每个 URL 来验证一个元素(一个脚本标签)是否存在。解决这个问题的最佳方法是什么?
from selenium import webdriver
#-*- coding: utf-8 -*-
import re
import urlparse
def findnth(haystack, needle, n):
parts= haystack.split(needle, n+1)
if len(parts)<=n+1:
return -1
return len(haystack)-len(parts[-1])-len(needle)
with open("sitemap.txt") as file:
for line in file:
substring = "url"
if substring in line:
start = line.find('h')
end = findnth(line, "<", 2)
print(line[start:end])
# #path = urlparse(line)
# urls = re.findall('https?://(?:[-\\w.]|(?:%[\\da-fA-F]{2}))+', line)
# #print(line)
# line.find('h')
# start = line.find('h')
# end = line.rfind('/')
# #print(line[, start[, end]])
# print(line)
for i in line:
driver = webdriver.Chrome()
driver.get(i)
source = driver.find_element_by_xpath("//script[@src='/scripts/file.js']");
解决方案
推荐阅读
- c# - 在实体框架中处理 DbContext 后使用 DB 对象
- sql - SQL - 查找总数的百分比并减去以获得两个新总数
- python - 遍历列表时的 Python 字符串格式
- html - 弹性盒子折叠在另一个之上
- java - 为什么Visual Studio Code在实际输出之前显示路径使用Java时
- javascript - x 轴刻度未出现在 d3 中
- macos - * 在 Mac 终端中跟随文件名是什么意思
- javascript - 通过ajax发送一个js数组
- linux - 如何使用 puts (AT&T, x86_64) 重新格式化要打印为字符串的整数
- javascript - 为什么我不能添加任务并将其呈现到列表中?