python - 如何从两个指定信息之间的字符串中获取特定字符串
问题描述
我为令人困惑的标题道歉。我环顾四周,知道如何在两个指定字符之间获取字符串,但我不确定如何在短语和字符之间获取字符串,例如src="the information i want"
. 在这种情况下,我希望我的起点是src="
,终点是"
起点之后的第一个。我将如何在 get 方法中指定这些参数?
以下是我寻求帮助的输出。我不想手动复制和粘贴第二个 URL,而是想将该字符串分配给一个变量以自动执行该过程。
>>> %Run myProject.py
enter URL
https://www.instagram.com/p/CAYGHWFFp-x/
<video class="tWeCl" playsinline="" poster="https://scontent-iad3-1.cdninstagram.com/v/t51.2885-15/e35/100101005_584997515466659_2719890114744519125_n.jpg?_nc_ht=scontent-iad3-1.cdninstagram.com&_nc_cat=111&_nc_ohc=DI3B3wg_vaQAX_MvEcQ&oh=06b611ef41299d4f0278467fb1d74e94&oe=5EC66079"
preload="none" src="https://scontent-iad3-1.cdninstagram.com/v/t50.2886-16/98205256_176119867089312_5443572653160790508_n.mp4?_nc_ht=scontent-iad3-1.cdninstagram.com&_nc_cat=100&_nc_ohc=JtZXc2HiQ9kAX_097NE&oe=5EC68ACC&oh=ac92032cb89fa1dfbcb5f2fa9016c9ba" type="video/mp4"></video>
enter the URL
太感谢了!
解决方案
您可以使用Beautiful Soup来解析此内容。然后您可以查找video
元素,并读取它们的src
属性。
from bs4 import BeautifulSoup
soup = BeautifulSoup(text, 'html.parser')
for video in soup.find_all('video'):
print(video.get('src'))
输出
https://scontent-iad3-1.cdninstagram.com/v/t50.2886-1698205256_176119867089312_5443572653160790508_n.mp4?_nc_ht=scontent-iad3-1.cdninstagram.com&_nc_cat=100&_nc_ohc=JtZXc2HiQ9kAX_097NE&oe=5EC68ACC&oh=ac92032cb89fa1dfbcb5f2fa9016c9ba
推荐阅读
- algorithm - CRS格式的稀疏矩阵乘法
- python - 用列表列表屏蔽两列(Pandas df)
- r - 使用 R 中 k 的奇数值介于 1 和 21(含)之间的类包执行 KNN
- javascript - 如何使用带有 json 的 javascript 从站点中提取信息?
- jndi - JNDI,使用没有用户/密码的 Persistence.xml,仅从独立的 RMI 获得 DataSource
- asp.net - 为什么我的 Web Api(完整框架)项目不会生成 Xml 文档文件
- django - 无法通过虚拟机内的 Nginx 代理到 Websocket
- ssh - 如何使用 SSH 使用密码连接到 GCP VM 实例?
- spring-boot - 如何在保留旧参数的同时添加参数 URL?
- css - 如何改变纯css动画的前景色?