首页 > 解决方案 > 自动 Webscrape Bloominberg

问题描述

有没有办法使用 Beautiful soup 从股票列表中自动搜索Bloomingburg [T、APPL、PBCT、MSFT]?例如,如果您查看此链接https://www.bloomberg.com/quote/T:US,这是布卢明堡的 T 股图表,我提取 PEGY 比率,然后返回 CVS 文件。任何有解决方案或可以帮助我朝着正确方向发展的人都会有所帮助。

这是我在 pycharm 中的一个起始骨架。

import bs4
import json
from urllib.request import urlopen, Request
from bs4 import BeautifulSoup as soup
import csv



#with open("tickers.txt") as f:
    #stocks = f.read().splitlines()

stocks = ['T', 'PBCT', 'MSFT', 'AAPL']

for link in stocks:
    url = 'https://www.bloomberg.com/quote/' + link + ':US'
    print(url)
    uClient = urlopen(Request(url, headers={'User-Agent': 'Mozilla'}))
    page_html = uClient.read()
    uClient.close()
    page_soup = soup(page_html,"html.parser")
    PEGY = page_soup.findAll("span",{"class":"fieldValue__2d582aa7"})
    print(PEGY)

输出:它似乎在循环访问正确的网站,但没有抓取 PEGY。

https://www.bloomberg.com/quote/T:US
[]
https://www.bloomberg.com/quote/PBCT:US
[]
https://www.bloomberg.com/quote/MSFT:US
[]
https://www.bloomberg.com/quote/AAPL:US
[]

Process finished with exit code 0

标签: pythonweb-scrapingbeautifulsoupweb-crawler

解决方案


推荐阅读