python - Python 中 (\xa0) 和 () 的正则表达式).*()
问题描述
只是阅读了一些用于预处理文本数据的代码,然后遇到了这些正则表达式,并且正在努力弄清楚它们的含义。
ReviewText = ReviewText.str.replace('(<a).*(>).*(</a>)', '')
ReviewText = ReviewText.str.replace('(\xa0)', ' ')
解决方案
好吧,看起来他们正在使用 regexp 玩 HTML。. . 通常,人们对此不屑一顾,但鉴于您正在使用,而不是开发,我们现在将忽略该问题。
看起来第一行需要:
<a href="https://www.w3schools.com">Visit W3Schools.com!</a>
并将其压制为空。
第二个采用显示的字符串并将其更改为空格。
正如上面所说的,你需要正则表达式和输入来实际做任何事情。一旦你有了 regexp 和一些输入,我建议你使用 regexp checker 来处理输入。. . 像这里(或相等):https ://pythex.org/
推荐阅读
- css - 我在 iphone7 上的网站两边都有空白。我使用了溢出 x 隐藏但它导致了另一个问题
- docker - 如何在 Visual Studio 2019 配置中将主机平台类型从 linux/amd 更改为 linux/arm?
- github-api - 如何在 Github 的 GraphQL API 中过滤 Repository.refs?
- java - Sqoop 导入失败 java.lang.Exception: java.lang.RuntimeException: java.lang.ClassNotFoundException: Class QueryResult not found
- nuget - 使用 NuGetCommand@2 将包推送到 nuget.org
- python - 如何识别嵌入式 Python 所需的 C 运行时文件?
- php - 如何在php中合并没有重复的数组
- regex - 在语法高亮规则中结合 vim 前瞻和后瞻约束
- flutter - 颤振修复没有给出快速修复不推荐使用的方法/参数的建议
- javascript - 旋转div中的传单地图拖动方向问题