python - 用于检查网站是否有指向其他网站的 URL 的 Python 脚本
问题描述
假设我有一个 xls 或 csv 文件(在某些云上),其中包含网站列表,其中包含指向我网站上某些内容的 URL。我想写一个脚本去给定的网站,检查链接是否仍然存在以及它是否具有“关注”属性。哪个工具和库最适合它。我考虑为此使用 Selenium。
解决方案
是的,您可以使用 selenium 自动化 python 中的内容。
或者,您可以读取 csv/xls 文件并使用 python 中的 pandas 将值存储为数据框。
您可以遍历网站并存储网站是否正常工作的结果。
# sample code for storing csv/xls in dataframe
filepath = 'data.csv'
df = pd.read_csv(filepath) || pd.read_excel(filepath, index_col=0)
print(df)
# sample code for checking website exists
import requests
url = 'http://www.example.com'
request = requests.get(url)
if request.status_code == 200:
print('Web site exists')
else:
print('Web site does not exist')
最后以 csv/xls 的形式存储结果。
推荐阅读
- python - 在seaborn pairplot中旋转ylabel
- c# - 将 Action 作为参数传递给方法并实例化
- javascript - Uncaught ReferenceError: Modernizr is not defined at HTMLDocument In Google Console
- r - 只有当它等于一个条件时才删除最后两个字符
- python - 只能比较具有相同标签的 Series 对象
- linux - 在 centOS 中运行运行文件时出错 - 显示错误
- python - 提取自定义 XML 标记
- php - 在 null (PostsController) 上调用成员函数 store()
- java - 使用二分搜索查找数字的平方根
- javascript - v-for 不重新渲染数组 vue js