python - .txt.File 中带有 Selenium 的安全 dublets
问题描述
所以,我的目标是编写一个脚本,用来抓取用户,在 Instagram 上使用特定的主题标签,并将他们的帐户写入 .txt 文件,而且它大部分都有效!
我的问题是,即使一些帐户发布了复数图片,我的脚本确实只显示每个名称一次。任何想法,它如何能够计算它们或让我的脚本不删除双峰?
我寻找了一切,但找不到解决方案。
这是我编写代码的一部分:
def generate_initial_information_txt(initial_information):
initial_information_txt = open("initial_information", "w+")
for user in initial_information:
initial_information_txt.write(user + "\n")
这是查找名称的部分:
for user in range(30):
el = self.driver.find_element_by_xpath('/html/body/div[4]/div[2]/div/article/header/div[2]/div[1]/div[1]')
el = el.find_element_by_tag_name('a')
time.sleep(2)
profile = el.get_attribute('href')
open_recent_posts_set.add(profile)
time.sleep(2)
next_button = self.driver.find_element_by_xpath('/html/body/div[4]/div[1]/div/div/a[2]')
next_button.click()
time.sleep(2)
URL 将是 https://instagram.com/explore/tags/hansaviertel_ms
所以我开始抓取“最近”帖子,例如前 6 个中的 5 个发布的“Hansaforum”。如果我插入一个 6 的范围,它只会抛出一个包含两个帐户的 .txt 文件,而不是 5 倍“汉莎论坛”。我想以任何方式获得次数。–
谢谢 :)
解决方案
推荐阅读
- javascript - 尝试使用悬停创建显示动画
- node.js - 在 WSL2 中运行的 Docker 容器中运行 headful Puppeteer
- java - 为什么 spring 给我一个空列表?
- r - 初学者问题:如何从列中删除日期?
- spring-boot - 没有找到能够从类型转换为类型 #2 的转换器
- python - 获取点列表并将它们设为 vtk.Points 和 vtk.CellArray 并尝试转换为 vtkPolyData
- jquery - net core 3.1 ajax 参数未发送到控制器
- python - 如何编写一个 python 程序,从用户那里获取一个数字并打印该数字的除数,然后打印有多少个除数?
- c++ - 函数 try 块是否允许我们解决异常?
- g++ - 如何在 CentOS 8 上安装 g++ 4