首页 > 解决方案 > Python 中的电子邮件正则表达式

问题描述

我在 python 中使用以下正则表达式来提取从 BS4 对象(html 页面)传递的电子邮件地址。

re.findall(r"[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,4}",r.text)

我遇到的问题是,正则表达式会在电子邮件地址之上返回内容,例如,网站上的电子邮件地址可能是“me@email.com”,但在此之前可能有电话号码“+ 441234567890”,因此输出将是“+441234567890me@email.com”。

我该如何解决这个问题?

标签: pythonregex

解决方案


推荐阅读