首页 > 解决方案 > Python:如果没有 XML 标记,则打印“空白”以及输出

问题描述

data="<database>
<zone1>
<name>
<firstname>John</firstname> 
<lastname>cena</lastname> 
<job>Administrator</job> 
<location>sunnyvale</location> 
<age>19</age> 
</name>
</zone1>

<zone2>
<name>
<firstname>mark</firstname> 
<job>Agent</job> 
<location>Bangalore</location> 
<age>22</age> 
</name>
</zone2>

<zone3>
<name>
<firstname>patrick</firstname> 
<lastname>phillips</lastname>
<job>Developer</job> 
<location>Philadelphia</location> 
<age>28</age> 
</name>
</zone3>

<zone4>
<name>
<firstname>patrick</firstname> 
<job>Developer</job> 
<location>Philadelphia</location> 
<age>28</age> 
</name>
</zone4>
</database>"    

import requests
from bs4 import BeautifulSoup
import lxml
soup = BeautifulSoup(data,lxml')

last_name=[v.get_text() if soup.find_all('lastname') else 'blank' for v in soup.find_all('lastname')]
print (last_name)

这是上述代码的输出。

['塞纳','菲利普斯']

上面的代码有什么问题?有人告诉我上面的代码需要改变什么吗?我想要下面的输出。(即如果 XML 标记不存在,则应添加“空白”)

['cena','空白','菲利普斯','空白']

标签: pythonxmlbeautifulsouppython-requestslxml

解决方案


尝试:

from bs4 import BeautifulSoup
import lxml
soup = BeautifulSoup(data,'lxml')

last_name=[v.find('lastname').get_text() if v.find('lastname') else 'blank' for v in soup.find_all('name')]
print (last_name)
  • 查找所有name标签 -->soup.find_all('name')
  • 检查是否namelastname标签 -->if v.find('lastname')

推荐阅读