python - 自动 Webscrape Bloominberg
问题描述
有没有办法使用 Beautiful soup 从股票列表中自动搜索Bloomingburg [T、APPL、PBCT、MSFT]?例如,如果您查看此链接https://www.bloomberg.com/quote/T:US,这是布卢明堡的 T 股图表,我提取 PEGY 比率,然后返回 CVS 文件。任何有解决方案或可以帮助我朝着正确方向发展的人都会有所帮助。
这是我在 pycharm 中的一个起始骨架。
import bs4
import json
from urllib.request import urlopen, Request
from bs4 import BeautifulSoup as soup
import csv
#with open("tickers.txt") as f:
#stocks = f.read().splitlines()
stocks = ['T', 'PBCT', 'MSFT', 'AAPL']
for link in stocks:
url = 'https://www.bloomberg.com/quote/' + link + ':US'
print(url)
uClient = urlopen(Request(url, headers={'User-Agent': 'Mozilla'}))
page_html = uClient.read()
uClient.close()
page_soup = soup(page_html,"html.parser")
PEGY = page_soup.findAll("span",{"class":"fieldValue__2d582aa7"})
print(PEGY)
输出:它似乎在循环访问正确的网站,但没有抓取 PEGY。
https://www.bloomberg.com/quote/T:US
[]
https://www.bloomberg.com/quote/PBCT:US
[]
https://www.bloomberg.com/quote/MSFT:US
[]
https://www.bloomberg.com/quote/AAPL:US
[]
Process finished with exit code 0
解决方案
推荐阅读
- ios - UITableView 重新加载部分时的内容插入更改
- python - 如何使用随机空格分隔符拆分此字符串?
- node.js - Express Node js对路由中的模式对象进行排序
- docker - 我有两个容器在不同的不同端口运行如何为两个容器做 DNS 条目
- java - 如何使用附加的安全 CSV 文件向用户发送电子邮件,并且电子邮件不应回复
- amazon-web-services - 下载 SpaceNet 数据集:权限被拒绝
- sql-loader - sql loader控制文件中的多个分隔符
- ionic-framework - Nativescript后台模式
- hyperledger-fabric - Composer SDK有什么用
- php - 将 URL 与 pdf 匹配并忽略 .pdf