设计AppServer面试讨论

Question

我在最近的系统设计访谈中遇到了以下问题：

设计与Cache和DB连接的AppServer。

我想出了这个：

public class AppServer{
    public Database DB;
    public Cache cache;

    public Value get(Key k){
        Value res = cache.get(k);
        if(res == null){
            res = DB.get(k);
            cache.set(k, res);
        }
    }

    public void set(Key k, Value v){
        cache.set(k, v);
        DB.set(k, v);
    }
}

这段代码很好并且工作正常，但问题的后续跟进是：

如果有多个线程怎么办？
如果有多个AppServer实例怎么办？
突然，AppServer的性能下降了很多，我们发现这是因为我们的缓存一直缺失。缓存大小是固定的（已经是最大的）。我们怎么能防止这种情况？

响应：

我回答说我们可以使用Locks或Conditional Variables。在Java中，我们可以为每个方法添加Synchronized以允许互斥，但是访问者提到这不是太有效并且只希望关键部分同步。

我认为我们只需要在void set(Key k, Value v)和Value get(Key k)的1套方法中同步2条线，但是采访者也推动同步res = DB.get(k);。我最后同意他，但不完全明白。线程是否具有独立堆栈和共享堆？因此，当一个线程执行get时，它将res存储在堆栈帧的局部变量中，即使另一个线程执行顺序执行，前一个线程仍保留其get值。然后每个线程设置它们各自的获取值。

我们如何处理AppServer的多个实例？

我想出了像Kafka这样的分布式队列解决方案，每次我们执行set / get命令时我们都会对该命令进行排队，但他也提到set是正常的，因为该操作在cache / db中设置了一个值，但是你会如何返回get的正确值？有人可以解释一下吗？

版本系统和事件系统还有可能的解决方案吗？

可能的解决方案： L1，L2，L3缓存 - 层和更多缓存区域/分段缓存 - 为用户组使用不同的缓存。还有其他想法吗？

将upvote所有富有洞察力的回应:)