首页 > 解决方案 > 如何仅根据 Guava 中外部存储的结果缓存一些活动数据?

问题描述

这是背景:我的外部存储中有 10 亿用户,其中大多数用户每天至少会被访问一次,但只有一些活动数据会被访问得更多。

所以对于番石榴,我可以写:

cache.get(key, new Callable() {
    Call() {
       return getExternal(key);        
    }
});

但是,每次我从外部存储加载时,Guava 都会将对象缓存到内存中。但是由于我有一个非常大的数据集,并且非常不活跃的数据也会被加载到内存中然后超过最大大小,因此真正活跃的数据可能会被淘汰。

所以我希望控制 Guava,告诉它这个数据不打算被缓存,像这样:

cache.get(key, new Callable() {
    Call() {
       MyObject o = getExternal(key);      
       if (!o.isActive())   {
           ...//do NOT cache
       }
    }
});

是否有可能在 Guava 中实现这个目标?

标签: javacachingguavagoogle-guava-cache

解决方案


根据Guava Cache Explanation,如果您通过Cache.get.

所以有两种方法可以处理这个问题:

1) 使用 检索缓存外的值,并使用( Inserted directlyCache.getIfPresent )直接插入它们:Cache.put

MyObject o = cache.getIfPresent(key);
if (o == null) {
    o = getExternal(key);
    if (o.isActive()) {
        cache.put(key, o);
    }
}

2)从缓存中删除非活动值,从(显式删除Cache.invalidate)获得它:Cache.get

MyObject o = cache.get(key, () -> getExternal(key));
if (!o.isActive()) {
    cache.invalidate(key);
}

编辑:实际上有第三种方法,但它比Ben 的建议更强大:

MyObjectHolder holder = new MyObjectHolder();
cache.asMap().compute(key, holder::computeActive); // discards the result of compute()
MyObject o = holder.result;

其中MyObjectHolder

private static class MyObjectHolder {
    MyObject result = null;

    MyObject computeActive(String key, MyObject oldValue) {
        if (oldValue != null) {
            result = oldValue;
            return oldValue;
        }
        result = getExternal(key);
        return result.isActive() ? result : null; // cache only active values
    }
}

推荐阅读