首页 > 解决方案 > 遍历 HashMaps 是如何在内存中工作的:Rust

问题描述

我知道如何在 Rust 中迭代 HashMap,但是,我对它在内存中的工作方式有点困惑。我们如何迭代没有顺序存储在内存中的值?非常感谢在堆和堆栈级别对以下代码的详细解释。

use std::collections::HashMap;

let name = vec![String::from("Charlie"), String::from("Winston"), String::from("Brian"), String::from("Jack")];
let age = vec![50, 5, 7, 21];

let mut people_ages: HashMap<String, i32> = name.into_iter().zip(age.into_iter()).collect();


for (key, value) in &people_ages {
    println!("{}: {}", key, value);
}

标签: data-structuresrusthashmapheap-memory

解决方案


文档介绍的末尾,提到该实现依赖于SwissTables 的 C++ 实现。此页面包含有关两个变体的插图:基于“平面”和“节点”。

这两种变体之间的主要区别在于指针稳定性。在基于“节点”的版本中,键值对一旦插入,即使哈希被重新组织,也会将它们的地址保存在内存中。在 « flat » 版本中,一些插入/删除可以使之前的键值对在内存中移动。

当谈到 Rust 实现时,我没有足够的经验来确定任何具体细节,但我根据你的例子尝试了这个简单的例子。

use std::collections::HashMap;

fn main() {
    let name = vec![
        String::from("Charlie"),
        String::from("Winston"),
        String::from("Brian"),
        String::from("Jack"),
    ];
    let age = vec![50, 5, 7, 21];
    let mut people_ages: HashMap<String, i32> =
        name.into_iter().zip(age.into_iter()).collect();
    let mut keys = Vec::new();
    let mut values = Vec::new();
    for (key, value) in &people_ages {
        keys.push(key);
        values.push(value);
        let key_addr = key as *const String as usize;
        let value_addr = value as *const i32 as usize;
        println!("{:x} {:x} {}: {}", key_addr, value_addr, key, value);
    }
    // people_ages.insert("Bob".to_owned(), 4); // mutable and immutable borrow
    println!("keys: {:?}", keys);
    println!("values: {:?}", values);
}
/*
55e08ff8bd40 55e08ff8bd58 Brian: 7
55e08ff8bd20 55e08ff8bd38 Charlie: 50
55e08ff8bd00 55e08ff8bd18 Winston: 5
55e08ff8bce0 55e08ff8bcf8 Jack: 21
keys: ["Brian", "Charlie", "Winston", "Jack"]
values: [7, 50, 5, 21]
*/

注释掉的行(插入)被拒绝,因为我们不能在保留对其内容的引用的同时更改哈希图。因此,我(我不确定)该实现不依赖于基于“节点”的变体,因为我们无法利用它提供的指针稳定性(由于 Rust 中的所有权模型),并且可能它依赖于« flat » 变体。

这意味着我们可以期望与相同哈希关联的键值对紧密地打包在内存中,并且迭代它们应该与迭代向量非常相似:常规进程(但是有一些跳过)对缓存预取非常友好. 打印地址倾向于确认猜测(但是测试还不够完整),并显示出向后的进展。


推荐阅读