python - 在python中读取和写入文件
问题描述
我有以下 python 脚本,我想在其中对图像 src 路径进行一些修改,然后将它们写回到同一个文件中:
#!/usr/local/bin/python
# -*- coding: utf-8 -*-
import os
import sys
import re
from operator import itemgetter
import csv
from BeautifulSoup import BeautifulSoup as BSHTML
azure = ['cdn.core.windows.net', 'blob.core.windows.net']
walk_dir = ["www", "sites"]
image_paths = []
for x in walk_dir:
for root, dirs, files in os.walk(x, topdown=False):
for filename in files:
file_path = os.path.join(root, filename)
with open(file_path, 'rb') as f:
f_content = f.read()
if filename.endswith('.html'):
soup = BSHTML(f_content)
images = soup.findAll('img')
print(filename, file_path)
for image in images:
try:
image_src = image['src'].split('?')
print(image_src)
image_paths.append(image_src[0])
except:
pass
我不清楚现在最好的方法是什么image_src
,然后重新编写它,然后在所有图像都更新后最后保存文件?
非常感谢任何建议
解决方案
推荐阅读
- r - 传单 R 中的循环
- sql-server - 将 SQL Server Service Broker 与多个路由一起使用
- elasticsearch - 如何将 Elastic Search 数据从 n 节点集群备份和恢复到 m 节点集群
- excel - 将 Excel 公式放入 IF 公式中
- web-services - 在 spring-boot 中使用 SOAP 服务
- python - 在熊猫中按字符串列编号的名称聚合列值
- amazon-s3 - 如何在 S3 中读取经过训练的数据文件
- python-3.x - 是否可以以异步/等待方式将任务发送到 pyRQ redis 队列?
- node.js - 如何在守护程序节点中获取有效负载?
- c - 如何确保生产者和消费者线程一个接一个地无限运行?