首页 > 解决方案 > Python BeautifulSoup4 只显示标签但不显示文本

问题描述

我正在练习使用 BeautifulSoup4 从网站上抓取数据的网页抓取。但是,当我运行我的代码时,当我在网站上检查元素时,它只显示开始标签和结束标签,当它们之间有明显的文本时。

我的代码:

import requests
from bs4 import BeautifulSoup as bs

url = 'https://emenscr.nesdc.go.th/thaime/loanact/view.html?id=43k11nkm0VFwVVOZxlX9'
r = requests.get(url).text
soup = bs(r,'lxml')

p_name = soup.find('span', id='viewer_loanact_group')
print(p_name)

输出:

In [54]: runcell(0, 'D:/computer_vision_project/bpm/untitled3.py')
<span id="viewer_loanact_group"></span>

的HTML:

<tr>                                                               
<th>กลุ่มของข้อเสนอโครงการ</th>
 <td>
  <span id="viewer_loanact_group">ข้อเสนอระดับโครงการย่อยที่มีวัตถุประสงค์เพื่อฟื้นฟูเศรษฐกิจและสังคม ตามบัญชีแนบท้าย พ.ร.ก. เงินกู้ฯ (กลุ่มที่ 3)
  </span>
 </td>
</tr>

标签: pythonweb-scrapingbeautifulsoup

解决方案


chromedriver 下载链接:https ://chromedriver.chromium.org/downloads

**解压并将.exe文件复制到一个文件夹

import time
from selenium import webdriver

chrome_driver_path = "**path of the folder/chromedriver.exe"
driver = webdriver.Chrome(executable_path=chrome_driver_path)


url = 'https://emenscr.nesdc.go.th/thaime/loanact/view.html?id=43k11nkm0VFwVVOZxlX9'
driver.get(url)
time.sleep(10)
p_name = driver.find_element_by_xpath('//*[@id="viewer_loanact_group"]')
print(p_name.text)

推荐阅读