hash - 128 位 SHA-1 散列是否比 MD5 散列更安全?
问题描述
SHA-1 被认为比 MD5 更安全,至少有两个原因:更大的散列(160 位对 128 位)和更好的散列函数。
我需要在几百万个字符串上生成散列。通常,即使对于 MD5,发生碰撞的可能性也应该非常低。我知道 MD5 已经很老了,通常不被认为是安全的,但在我的情况下,故意攻击不是问题(没有外部访问,没有激励等)。我只需要一个相当安全的散列函数,不会浪费太多位,128 位应该绰绰有余。所以我想知道 - 如果我只得到 SHA-1 哈希的前 128 位,那会比 MD5 的 128 位更好吗?“更好”是指“不太可能引起碰撞”。
解决方案
我用 4,292,907 个不同的字符串运行了一些“真实世界”测试。我使用了一个 11 字符长的十六进制散列子字符串(换句话说,一个 44 位部分)。例子:
HASH: 629a09633488e9b2aaf2f5a606706da3
Test 1: 629a0963348
Test 2: 29a09633488
Test 3: 9a09633488e
...
从理论上讲,我计算出的碰撞概率约为 41%(基于“生日悖论概率”公式)。但那是理论,它假设真正的随机分布。所以我想凭经验测试 MD5 和 SHA-1 并查看结果。它们在这里(右侧的数字显示碰撞次数):
[MD5] [SHA-1]
Test No 1: 2 Test No 1: 0
Test No 2: 0 Test No 2: 0
Test No 3: 1 Test No 3: 0
Test No 4: 0 Test No 4: 1
Test No 5: 0 Test No 5: 0
Test No 6: 0 Test No 6: 1
Test No 7: 1 Test No 7: 0
Test No 8: 2 Test No 8: 0
Test No 9: 1 Test No 9: 0
Test No 10: 1 Test No 10: 0
Test No 11: 0 Test No 11: 1
Test No 12: 0 Test No 12: 1
Test No 13: 0 Test No 13: 0
Test No 14: 0 Test No 14: 1
Test No 15: 0 Test No 15: 1
Test No 16: 0 Test No 16: 1
Test No 17: 1 Test No 17: 1
Test No 18: 1 Test No 18: 1
Test No 19: 0 Test No 19: 0
Test No 20: 0 Test No 20: 1
TOTAL: 8 TOTAL: 10 // No of tests with at least 1 collision
结论:与通过“生日悖论概率”公式计算的“理论”概率相比,MD5 和 SHA-1 的碰撞概率都没有显着降低。我知道这个测试并不完美,应该用一粒盐来进行,但至少对我来说,它表明我可以严重依赖于通过“理论”公式计算碰撞的机会而不必担心我的计算与事实相去甚远。
推荐阅读
- sql - HSQLDB (HyperSQL):更改 TEXT 表中的列类型
- c# - 在webdriver中获取自动化页面的状态栏
- python - 无法在python中调用keras模块
- polymer - 是否可以在 Polymer 应用程序的 LitElement 中使用 vaadin-grid?
- arrays - 在 Visual Basic (VB) 中声明具有初始化值的字符串数组)
- python - 使用服务帐号从 Python 部署 App Engine 版本
- c# - 尝试使用 C# 读取特定的 Xml 值
- arrays - 类型“任何”没有下标成员 - 同时删除重复条目
- c - 如何在同一个 autotools 项目中为两个程序提供不同的构建选项
- amazon-web-services - 无权执行:dynamodb:Scan Lambda