首页 > 解决方案 > Python 替换文本 BeautifulSoup

问题描述

我对这部分python有疑问。它可以工作,但如果任何数据包含逗号,它显然会弄乱我的 CSV。

import requests
import sys
from bs4 import BeautifulSoup

url = requests.get(sys.argv[1])

html = BeautifulSoup(url.content,'html.parser')

for br in html.find_all("br"):
    br.replace_with(" ")

for tr in html.find_all('tr'):
    data = []   

    for td in tr.find_all('td'):
        data.append(td.text.strip())

    if data:
        print("{}".format(','.join(data)))

是否可以用空格替换逗号?

例如,从...

column 1    column 2    column,3    column 4

至...

column 1,column 2,column 3,column 4

目前我得到这个导致问题...

column 1,column 2,column,3,column 4

标签: pythonbeautifulsoup

解决方案


尝试data.append(td.text.strip().replace(',', ' ')


推荐阅读