首页 > 解决方案 > 如何在每一轮中多次散列并连接一个字符串

问题描述

我正在编写一个程序,它R在密码末尾连接一个单词,然后计算 SHA-256 哈希。稍后,R在十六进制结果的末尾再次添加单词并使用 SHA256 计算新的哈希值。

我希望这重复 100 次。每次我想打印哈希。

所以像这样,在伪代码中:

hash = SHA256(...(SHA256(SHA256(“password”||R)||R)||R)..)

我目前正在通过散列 2 次来测试我的代码:

   String R = "f@ghj!$g";
   hash = password.concat(R);

   MessageDigest md = MessageDigest.getInstance("SHA-256");
   digest = hash.getBytes(StandardCharsets.UTF_8);

   for (int i=0;i<2;i++) {

     md.update(digest);
     digest = md.digest();

     hash = String.format("%064x", new BigInteger(1,digest)).concat(R);
     System.out.println(hash);

     digest = hash.getBytes(StandardCharsets.UTF_8);
   }

让我们暂时忘记这个串联。

例如无法理解为什么以下两个代码会产生不同的结果:

代码 1:

   for (int i=0;i<2;i++) {

     md.update(digest);
     digest = md.digest();

   }

 hash = String.format("%064x", new BigInteger(1,digest));   
 System.out.println(hash);

代码 2:

   for (int i=0;i<2;i++) {

     md.update(digest);
     digest = md.digest();
     //convert hash to string
     hash = String.format("%064x", new BigInteger(1,digest));
     //convert string again to bytes
     digest = hash.getBytes(StandardCharsets.UTF_8);
   }

 System.out.println(hash);

我的问题是:Byte[]每次将哈希()解码为十六进制字符串以连接R单词并以正确的方式再次编码为字节的正确方法是什么?

标签: javacryptographysha256hash-function

解决方案


代码片段 1 是正确的,但您需要在其中添加 print 语句才能获得预期的输出。但是,为此,您需要使用真正的十六进制编码器/解码器,但在java.util.


这是一个重做的示例,没有串联,我故意省略了它,以便让您有事可做。

该代码使用了一个相对较慢但易于记忆和阅读的toHex功能。第BigInteger一个需要构造 a BigInteger,这很浪费,甚至可能更慢。尽管代码对于 32 字节哈希值似乎可以正常工作,但我仍然认为代码难以维护。

public static byte[] printHexadecimalHashIterations(byte[] input, int iterations)
{
    var digest = input.clone();

    MessageDigest md;
    try
    {
        md = MessageDigest.getInstance("SHA-256");
    }
    catch (NoSuchAlgorithmException e)
    {
        throw new IllegalStateException("SHA-256 hash should be available", e);
    }

    for (int i = 0; i < iterations; i++)
    {
        md.update(digest);
        digest = md.digest();

        printDigest("Intermediate hash", digest);
    }

    printDigest("Final hash", digest);

    return digest;
}

public static void printDigest(String hashType, byte[] digest)
{
    var digestInHex = toHex(digest);
    System.out.printf("%s: %s%n", hashType, digestInHex);
}

public static String toHex(byte[] data)
{
    var sb = new StringBuilder(data.length * 2);
    for (int i = 0; i < data.length; i++)
    {
        sb.append(String.format("%02X", data[i]));
    }
    return sb.toString();
}

public static void main(String[] args)
{
    printHexadecimalHashIterations("password".getBytes(StandardCharsets.UTF_8), 2);
}

要消除这一点的主要内容是(安全)散列函数的数据由字节(或八位字节,如果您更喜欢该名称)组成。十六进制字符串只是这些字节的文本表示。它与数据本身不同。

您应该能够区分二进制数据和十六进制,这只是二进制数据的表示。永远不要像在问题中那样将二进制数据称为“十六进制”:这是一个危险信号,您没有得到区别。

但是,在您的情况下,您只需要十六进制即可将它们打印到屏幕上;您根本不需要将digest字节数组转换为十六进制;它仍然可用。所以你可以继续它。


如果您需要将此文本表示形式转换回字节,则需要执行十六进制解码。显然,您将再次需要一种不涉及此的好方法BigInteger。有很多库(Guava、Apache Commons、Bouncy Castle)在 SO上提供了很好的十六进制编码器/解码器和很好的问题/答案。代码片段 2 中的语句hash.getBytes(StandardCharsets.UTF_8)不执行十六进制解码,它执行字符编码


最后提示:这些update方法允许将数据流式传输到摘要函数中。这意味着您实际上不必连接任何东西来计算连接上的摘要:您只需执行多次调用即可update

快乐编程。


编辑:

为了执行你的任务,我会做这样的事情:

final byte[] passwordBytes = "password".getBytes(StandardCharsets.UTF_8);
final byte[] rBytes = "f@ghj!$g".getBytes(StandardCharsets.UTF_8);

digest.update(passwordBytes);
digest.update(rBytes);
byte[] currentHash = digest.digest();

for (int i = 1; i < iterations; i++)
{
    digest.update(currentHash);
    digest.update(rBytes);
    currentHash = digest.digest();
}

推荐阅读