regex - 格式化正则表达式以匹配目录
问题描述
我需要从 Github 存储库中的自述文件中提取目录。我使用 python 中的“请求”模块从自述文件中提取文本,现在我正在尝试使用正则表达式匹配目录。这是我提出问题的代码:
import requests
import os
import sys
import re
# Get readme page info via Github API.
rm_pg_url = ('https://api.github.com/repos/PillarOfSand/Projects/readme')
rm_pg = requests.get(rm_pg_url, timeout = 10)
rm_pg_content = rm_pg.json()
# Isolate download page. Get actual text from readme file.
download_url = rm_pg_content['download_url']
real_rm = requests.get(download_url, timeout = 10)
all_text = real_rm.text
toc_regex = re.compile(r'(?s)^## Table of Contents.*security\)$')
table_of_contents = toc_regex.search(all_text)
最后两行是我要特别说明的。table_of_contents
变量是 type None
,所以我使用的正则表达式不匹配任何东西。我正在搜索的文本字符串可以在以下 URL 中找到:
所以,我的实际问题是,我哪里出错了?如何调整我的正则表达式以匹配整个目录?
谢谢。
解决方案
推荐阅读
- javascript - 比较多维数组并向每个子元素添加属性,即使在子数组中也是如此
- go - Golang Gmail imap 搜索冻结
- relational-algebra - 这个对吗?关系代数 DBMS 不是 SQL
- python - 了解 pdb.set_trace() 之后的 pdb 输出
- android - firebase.notifications() 在 react-native-firebase 中抛出错误
- c# - 用于查找某人迟到的记录的 SQL 查询
- javascript - 如何让一根手指移动谷歌地图但*不是*两根手指
- python - 使用 Python 在 Raspberry Pi 3 上读取数字和模拟输入
- c# - 尝试安装没有强名称的程序集
- laravel - 在laravel中上传图像文件不起作用