python - 如何通过 BeautifulSoup 和 soup.select_one() 获取变量的值?
问题描述
ue_mid
如果您尝试使用 BeautifulSoup 抓取网页并使用此函数,如何获取变量的值: soup.select_one()
?
源代码中的变量列表如下所示:
var ue_id = 'XXXXXXXXXXXX',
ue_mid = 'ValueToGet',
ue_navtiming = 1;
非常感谢您!
解决方案
它是 JavaScript。您只能使用select_one()
从标签中获取文本<script>
,稍后您必须使用字符串的函数(或正则表达式)从字符串中提取它。
html = '''<script>
var ue_id = 'XXXXXXXXXXXX',
ue_mid = 'ValueToGet',
ue_navtiming = 1;
</script>'''
from bs4 import BeautifulSoup as BS
soup = BS(html, 'html.parser')
text = soup.select_one('script').get_text()
text = text.split("ue_mid = '")[1]
text = text.split("',")[0]
print(text)
# ValueToGet
推荐阅读
- python - 熊猫:重复的列,无法删除它们
- c++ - 为 VS2017 构建 OpenCascade
- c++ - C ++ Boost http客户端 - 保持连接活跃
- java - 为什么 rs.Next() 跳过列
- r - dplyr / tidyevaluation:如何将 mutate 中的表达式作为字符串传递?
- c# - HttpWebRequest 中缺少内容长度
- javascript - 单击日期时应触发日期选择器单击事件
- c# - 将图像上传到文件夹 MVC 5
- spring-batch - Spring Cloud Dataflow - 如何将凭据传递给任务
- .net-core - 在开发过程中伪造身份验证