首页 > 解决方案 > R需要替换URL中斜杠之间的文本

问题描述

我正在尝试替换 URL 中的数字以提高图像质量,但无法弄清楚如何正确转义 / 以使其正常工作。

我需要将://contentinfo.autozone.com/znetcs/product-info/en/US/nip/3289/image/1/ 更改为://contentinfo.autozone.com/znetcs/product-info/en/US /nip/3289/图像/10/

当然,https 在这两个 URL 之前,但如果我包含它,论坛会将其转换为图像。

标签: rwebweb-scraping

解决方案


我在一个在线片段上尝试了下面的代码,它运行良好。也使用了Aurèle的暗示。也许它会给你一个提示:

url <- "//contentinfo.autozone.com/znetcs/product-info/en/US/nip/3289/image/1/"
    
cat("Simple way\n")
simple <- gsub("/1/","/10/",url)
cat("Before: ", url, "\n")
cat("After: ", simple, "\n")
    
cat("Regex \n") As sugested by Aurèle
regex <- sub("\\d+/?$", "10/", url) 
cat("Before: ", url, "\n")
cat("After: ", regex, "\n")

推荐阅读