首页 > 解决方案 > Java:对象池和哈希集

问题描述

让我们假设以下课程...

class Foo {

  private Bar1 bar1;
  private Bar2 bar2;

  // many other fields

  @Override
  public boolean equals(Object o) {
    if (this == o) return true;
    if (o == null || getClass() != o.getClass()) return false;
    Foo foo = (Foo) o;
    if (!bar1.equals(foo.getBar1()) return false;
    if (!bar2.equals(foo.getBar2()) return false;
    // etc...
  }

  @Override
  public int hashCode() {
    int result = bar1.hashCode();
    result = 31 * result + bar2.hashCode();
    // etc...
  }

  // setters & getters follow...
}

每分钟创建、处理数千个 Foo 实例,然后在池中回收。工作流程如下:

Set<Foo> foos = new THashSet<>();
while (there-is-data) {

  String serializedDataFromApi = api.getData();
  Set<Foo> buffer = pool.deserializeAndCreate(serializedDataFromApi);
  foos.addAll(buffer);
}

processor.process(foos);
pool.recycle(foos);

问题是不同缓冲区之间可能存在重复的 foo 对象(具有相同的值)。这些被具体化为 Foo 的不同实例,但是在调用 foos.addAll(buffer) 时它们被认为是相等的。

我的问题是:

标签: javagarbage-collectionduplicatessetpooling

解决方案


这些“重复”实例发生了什么?他们“丢失”并收集垃圾了吗?

是的,这些将在当前迭代while (there-is-data)完成后立即有资格进行 GC

如果我想将这些实例保留在池中,那么在使用 addAll 和回收实例插入之前测试重复项的最有效方法是什么?

Set.addtrue如果元素被插入并且false它是重复的,则返回。所以你可以addAll

for (Foo f : buffer) {
  if (!foos.add(f)) {
    // handle duplicate
  }
}

不会对性能造成影响,因为addAll这样做 - 迭代并一一添加。


推荐阅读