python - 如何使用 python 和 selenium webdriver 遍历表并打印前 10 行的结果?
问题描述
使用 selenium webdriver 和 python,我能够找到搜索单元格并搜索以返回结果,但是我想打印返回的前 10 行的结果(减去标题行)。
我使用的网站是:http ://www.hoovers.com/company-information/company-search.html?term=simon 例如作为搜索词。
我已经搜索了一段时间并尝试了很多东西,包括 xpaths 和大多数错误。这是我迄今为止最接近的:
for row in mydriver.find_elements_by_class_name('cmp-company-directory'):
cell = row.find_elements_by_tag_name("td")[0]
print(cell.text)
但是它只返回第一行并且不会遍历表。有小费吗?蒂亚!
解决方案
在 Xpath 下试试这个,它将遍历表并打印前 10 行。
elements=driver.find_elements_by_xpath("//div[@class='clear data-table sortable-header dashed-table-tr alternate-rows']//tr/td")
counter=1
for element in elements:
print(element.text)
counter+=1
if counter==50:
break
输出:
Simon Property Group, Inc.
Indianapolis, IN, United States
$5538.64M
See Details
SIMON & SCHUSTER (UK) LIMITED
London, London, England
$60.39M
See Details
SIMON JERSEY GROUP LIMITED
Accrington, Lancashire, England
See Details
Simon Worldwide, Inc.
Irvine, CA, United States
$0.0M
See Details
Simon Property Group, L.P.
Indianapolis, IN, United States
$5538.64M
See Details
Günter Simon e.K. Inh. Carmen Simon
Ravensburg, Baden-Württemberg, Germany
See Details
Simon e Simon Servicos Odontologicos Ltda
Vere, Parana, Brazil
See Details
Simon Comercial e Industrial Ltda Em Recuperacao Judicial
Aparecida De Goiania, Goias, Brazil
See Details
Simon Levelt B.V.
Haarlem, Noord-Holland, The Netherlands
See Details
SIMON SAU
Barcelona, Barcelona, Spain
$115.95M
See Details
如果您只想打印公司名称的前 10 行,请尝试此操作。
elements=driver.find_elements_by_xpath("//div[@class='clear data-table sortable-header dashed-table-tr alternate-rows']//tr/td[@class='company_name']")
counter=0
for element in elements:
print(element.text)
counter+=1
if counter==10:
break
输出:-
Simon Property Group, Inc.
SIMON & SCHUSTER (UK) LIMITED
SIMON JERSEY GROUP LIMITED
Simon Worldwide, Inc.
Simon Property Group, L.P.
Günter Simon e.K. Inh. Carmen Simon
Simon e Simon Servicos Odontologicos Ltda
Simon Comercial e Industrial Ltda Em Recuperacao Judicial
Simon Levelt B.V.
让我知道这是否适合您。
推荐阅读
- google-data-studio - 有没有办法将当前时间戳添加到 Google Data Studio 报告中?
- android - 在 textView 中打印一个 json 文件
- javascript - 在 Jquery 中的单击功能在计算机上使用时不起作用
- png - 将ai文件转换为png后字体失真
- elm - 如何退出 elm repl?
- android - 如何在电话信息中读取 Android IP 地址状态?
- hyperledger-fabric - Hyperledger Fabric:缺少 etcdraft 配置
- javascript - Javascript频率计数器算法
- android - 矢量绘图在 Android 应用程序中无法正确显示
- java - 如何在Android中将ArrayList的所有元素显示为芯片