python - python 正则表达式查找和散列用户名
问题描述
我想hash usernames
在我的日志文件中 - 我的正则表达式没有按预期工作
输入示例:
Account Name: - Account Domain: - ImportantStuff Account Name: Foo bar Account Domain: my.bar
Account Name: Foo-bar Supplied Realm Name: my.bar ImportantStuff
Account Name: Foo99bar$ Account Domain: my.bar ImportantStuff Account Name: - Account Domain: -
我的正则表达式:
(((?!Account Name:\s+-\s+))(Account Name:\s+(\S+.+(?=\s+Account))))|(Account Name:\s+(\S+.+(?=\s+Supplied)))((?!Account Name:\s+-\s+))
我想过滤为:
if Pattern "Account Name: -" 忽略
if Pattern not "Account Name: -" 获取用户名
我无法过滤“-”作为分隔符,因为某些用户名包含“-”,这就是我使用 \s-\s (?!忽略模式)的原因。空格也是如此。
之后,用户名被散列:
result2 = re.sub(r'(((?!Account Name:\s+-\s+))(Account Name:\s+(\S+.+(?=\s+Account))))|(Account Name:\s+(\S+.+(?=\s+Supplied)))((?!Account Name:\s+-\s+))', lambda m: m.group(1) + hashlib.sha512(m.group(2)).hexdigest(), line)
起初我尝试 [^Account Name:\s+-\s+] 但当然,然后一切都得到匹配,这不在 [^] 范围内并且它不被视为字符串。
我能以某种方式这样做吗?:
((?!Account Name: - )|Account Name:\s+(.+?(?=\s+Account Domain|Supplied)))
我在跑步python 2.7
解决方案
Account Name:
当使用(?!\s+-\s)
负前瞻后跟 whitespaces-whitespaces时,您可能会失败所有匹配:
(Account Name:(?!\s+-\s)\s*)(.*?)(?=\s+(?:Account Domain|Supplied))
请参阅正则表达式演示。
细节
(Account Name:(?!\s+-\s)\s*)
- 第 1 组:Account Name:
不紧跟 1+ 个空格、-
一个空格 ((?!\s+-\s)
) 和 0+ 个空格(.*?)
- 第 2 组:除换行符之外的任何零个或多个字符,尽可能少(?=\s+(?:Account Domain|Supplied))
- 一个正向前瞻,需要 1+ 个空格,紧跟当前位置右侧的Account Domain
或子字符串。Supplied
请参阅Python 2 演示:
import re,hashlib
l = ['Account Name: - Account Domain: - ImportantStuff Account Name: Foo bar Account Domain: my.bar','Account Name: Foo-bar Supplied Realm Name: my.bar ImportantStuff','Account Name: Foo99bar$ Account Domain: my.bar ImportantStuff Account Name: - Account Domain: -']
for line in l:
print(re.sub(r'(Account Name:(?!\s+-\s)\s*)(.*?)(?=\s+(?:Account Domain|Supplied))',
lambda m: m.group(1) + hashlib.sha512(m.group(2)).hexdigest(), line))
输出:
Account Name: - Account Domain: - ImportantStuff Account Name: 45a19ebf5c5c04bf71e9819b29e9a71ee7b4f9b5d3de72615b9788da05eceb526cc47b18e108107a3e53ee2068c4da4fca8209e9e2d87560d6848823eebe803b Account Domain: my.bar
Account Name: 4ac1e08061b7216e9d3e0a44d6ca6512a25577a1e0675ba7cb439fc243e84d566dd0c1aac33f89c5c23e959fef5dc6a71cdd2adba257c81975caa822be4e5018Supplied Realm Name: my.bar ImportantStuff
Account Name: 7228cb36d1d3b5cd41d50d150defd13e06441eb2b6a4689f9356012607fb0ebf5680af49f743baf289a590a07f8da6077f5288a5d4000448bfc7fd303869d31f Account Domain: my.bar ImportantStuff Account Name: - Account Domain: -
推荐阅读
- javascript - 通过调用返回要打开的jsp名称的java方法打开新标签jsp
- ios - 删除collectionView中特定位置的特定单元格
- julia - 如何在 Julia 中表示抽象时间
- python - 由于版本问题,安装 virt-manager 时出错
- javascript - NodeJS:发送电子邮件(例如向我的应用程序的用户发送通知)无需对其进行身份验证或接收电子邮件
- cmake - 如何在 cmake 中正确链接库?
- python - PyCharm 中未解决的引用错误,即使代码运行正常
- c# - 如何反转 Array.Sort 的方向 - C#
- javascript - 当我点击下一个按钮时,上一个问题必须用反向动画删除,下一个问题必须用打字效果动画显示
- c - 为什么FD_ISSET()要在accept()建立连接之前判断