python - 刮英超联赛结果
问题描述
我想在输出中添加竞争和国家。我该怎么做?
我现有的代码是:
browser = webdriver.Chrome()
class GameData:
def __init__(self):
self.date = []
self.time = []
self.game = []
self.score = []
self.home_odds = []
self.draw_odds = []
self.away_odds = []
def parse_data(url):
browser.get(url)
df = pd.read_html(browser.page_source, header=0)[0]
game_data = GameData()
game_date = None
for row in df.itertuples():
if not isinstance(row[1], str):
continue
elif ':' not in row[1]:
game_date = row[1].split('-')[0]
continue
game_data.date.append(game_date)
game_data.time.append(row[1])
game_data.game.append(row[2])
game_data.score.append(row[3])
game_data.home_odds.append(row[4])
game_data.draw_odds.append(row[5])
game_data.away_odds.append(row[6])
return game_data
urls = {
"https://www.oddsportal.com/soccer/england/premier-league/results/"
}
if __name__ == '__main__':
results = None
for url in urls:
game_data = parse_data(url)
result = pd.DataFrame(game_data.__dict__)
if results is None:
results = result
else:
results = results.append(result, ignore_index=True)
我想在输出中添加竞争和国家。我该怎么做?
国家/地区的 XPATH:
/html/body/div[1]/div/div[2]/div[6]/div[1]/div/div[1]/div[3]/div[2]/div/div[1]/div/h2/span
XPATH 竞赛:
/html/body/div[1]/div/div[2]/div[6]/div[1]/div/div[1]/div[2]/div[1]/h1
如何将其集成到现有代码中?
解决方案
推荐阅读
- python - 带有参数的 Telegram Bot 可点击命令
- c# - AWS Lambda (C#) 是否允许从 s3 存储桶动态加载 DLL 并将其实例化以在 Lambda 函数中使用?
- json - 为一个结构解码多个 JSON 请求
- mfc-feature-pack - 在 CMFCTabCtrl 的选项卡标题中获取图标的区域?
- android - 继承片段的类在片段适配器中被认为是不兼容的
- vi - vi 在可视块中插入空格后标记第一个字符
- php - 如何在php中将动态值添加到二维数组
- python - 对 CSV 列求和,同时忽略 python 中的标题
- javascript - 如何在Javascript中调用一个类本身而不是它的实例?
- python - 如何在 Python 中创建返回此列表的所有组合的函数?