python - Python Selenium:无法从 Instagram 中获取 HREF 链接
问题描述
PostLinkExtraction = driver.find_element_by_xpath("//article[1]/div[3]/div[1]/div/div[2]/div[1][*[local-name()='a']]").get_attribute('href')
print (PostLinkExtraction)
我试图在我的 Instagram 时间轴上的第一个帖子下打印来自 Instagram 时间戳的 href 链接。上面的代码由于某种原因没有返回。下面是任何想要运行它并查看我可能出错的地方的代码,但我想要完成的总体目标是从 <-time> 标记中提取 href 链接。下图显示了 <-time> 标签在开发者工具中的位置
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
from time import sleep
from selenium.webdriver.common.keys import Keys
from selenium import webdriver
user = 'username'
passw = 'password'
driver = webdriver.Chrome(ChromeDriverManager().install())
driver.get('https://www.instagram.com/')
driver.implicitly_wait(10)
driver.find_element_by_name('username').send_keys(user)
driver.find_element_by_name('password').send_keys(passw)
Login = "//button[@type='submit']"
sleep(2)
driver.find_element_by_xpath(Login).submit()
sleep(1)
# Logs into Instagram
print ('Logged In')
#------------------------ATTENTION
NotNow = "//button[contains(text(),'Not Now')]"
driver.find_element_by_xpath(NotNow).click()
# Clicks Pop Up
print ('Close Pop Up')
# It's weird but the pop up opens once, only after this page.
# If ever a problem delete one, or have the first click be
# directed to your Instagram Profiles timeline
NotNow = "//button[contains(text(),'Not Now')]"
driver.find_element_by_xpath(NotNow).click()
#Clicks Pop Up; Comment out the line above if it causes an error
print ('Close Pop Up')
#-----------------------------------
driver.refresh()
print ('refreshing')
driver.implicitly_wait(10)
PostLinkExtraction = driver.find_element_by_xpath("//article[1]/div[3]/div[1]/div/div[2]/div[1][*[local-name()='a']]").get_attribute('href')
print (PostLinkExtraction)
解决方案
推荐阅读
- laravel - 如何在 voyager laravel admin 中翻译归属关系
- scala - 为什么这种类型相等检查在 SBT 中失败但在我的 IDE 中成功?
- ruby-on-rails - 正则表达式无法匹配 punycode url
- json - 如何使用 bash 脚本将 json 值添加到 json 文件
- spring - springboot中如何创建二级数据库依赖于主库的两个数据源(初始二级库未知)
- deployment - 如何控制 openshift 推出(CI/CD 管道)?
- sql-server - 使用字符串的 SQL Server 日期和时间格式
- mysql - 关于select ... in的sql性能
- fastlane - 快速通道 FASTLANE_APPLE_APPLICATION_SPECIFIC_PASSWORD 不起作用?
- java - EclipseLink 如何检测首次访问以进行延迟获取?