首页 > 解决方案 > 尝试“一切”后如何修复 IndexError

问题描述

我的 Python 网络爬虫收集了大量数据,然后突然停止并出现 IndexError。我尝试了不同的页面和设置,但它们在随机位置停止。

(部分)我的代码如下

numListings = int(re.findall(r'\d+', numListingsRaw)[0])
numPages = math.ceil(numListings / 100)

print(numPages) 


for numb in range(1, numPages):
    pageSoup = make_soup("https://url" + str(numb) + "&pmax=5000&srt=df-a")
    containers = pageSoup.findAll("li", {"class":"occasion popup_click_event 
    aec_popup_click"})

for container in containers:

    ID = container.a["data-id"]
    titel = container["data-vrnt"].replace(",", "|")
    URL = container.a["href"]
    merk = container["data-mrk"]
    soort = container["data-mdl"]
    prijs = container.find("div", {"class":"occ_price"}).text.strip()

    ## Bouwjaar en km
    bouwjaarKM = container.span.text.strip().split(", ")
    bouwjaarRaw = bouwjaarKM[0].split(": ")
    bouwjaar = bouwjaarRaw[1]

    km_int = int(''.join(filter(str.isdigit, bouwjaarKM[1])))
    km = str(km_int)

    rest = container.find("div", {"class":"occ_extrainfo"}).text.strip()
    rest_split = rest.split(", ")
    brandstof = rest_split[0]
    inhoud = rest_split[1]
    vermogen = rest_split[2]
    transmissie = rest_split[3]
    carroserie = rest_split[4]
    kleur = rest_split[5]

这是确切的错误消息:

"Traceback (most recent call last):
File "Webscraper_multi2.py", line 62, in <module>
inhoud = rest_split[1]
IndexError: list index out of range"

我知道它与 for 循环有关,但我无法理解它。

非常感谢您的帮助。提前致谢,

汤姆

标签: python

解决方案


打印 的值rest_split。您会发现它是一个长度小于 2 的列表,因为这是列表具有索引 1 所需要的。


推荐阅读