分布式改造剧集三:Ehcache分布式改造

Posted kidezyq

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了分布式改造剧集三:Ehcache分布式改造相关的知识,希望对你有一定的参考价值。

第三集:分布式Ehcache缓存改造

前言

? 好久没有写博客了,大有半途而废的趋势。忙不是借口,这个好习惯还是要继续坚持。前面我承诺的第一期的DIY分布式,是时候上终篇了---DIY分布式缓存。


探索之路

? 在前面的文章中,我给大家大致说过项目背景:项目中的缓存使用的是Ehcache。因为前面使用Ehcache的应用就一台,所以这种单机的Ehcache并不会有什么问题。现在分布式部署之后,如果各个应用之间的缓存不能共享,那么其实各自就是一个孤岛。可能在一个业务跑下来,请求了不同的应用,结果在缓存中取出来的值不一样,

造成数据不一致。所以需要重新设计缓存的实现。

? 因为尽量不要引入新的中间件,所以改造仍然是围绕Ehcache来进行的。搜集了各种资料之后,发现Ehcache实现分布式缓存基本有以下两种思路:

  • 客户端实现分布式算法: 在使用Ehcache的客户端自己实现分布式算法。

算法的基本思路就是取模:即假设有三台应用(编号假设分别为0,1,2),对于一个要缓存的对象,首先计算其key的hash值,然后将hash值模3,得到的余数是几,就将数据缓存到哪台机器。

  • 同步冗余数据: Ehcache是支持集群配置的,集群的各个节点之间支持按照一定的协议进行数据同步。这样每台应用其实缓存了一整份数据,不同节点之间的数据是一致的。

? 虽然冗余的办法显得有点浪费资源,但是我最终还是选择了冗余。具体原因有以下几点:

  • 分布式算法的复杂性: 前面所讲的分布式算法只是最基本的实现。事实上实现要比这个复杂的多。需要考虑增加或者删除节点的情况,需要使用更加复杂的一致性hash算法
  • 可能导致整个应用不可用: 当删除节点之后,如果算法不能够感知进行自动调整,仍然去请求那个已经被删除的节点,可能导致整个系统不可用。

Demo

? 最终我的实现采用RMI的方式进行同步

配置ehcache

? spring-ehcache-cache.xml

<?xml version="1.0" encoding="UTF-8"?>
<ehcache xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:noNamespaceSchemaLocation="http://ehcache.org/ehcache.xsd" name="businessCaches">

  <diskStore path="java.io.tmpdir/ehcache"/>
  <cache name="business1Cache"
         maxElementsInMemory="10000000"
         eternal="true"
         overflowToDisk="false"
         memoryStoreEvictionPolicy="LRU">
         <cacheEventListenerFactory
            class="net.sf.ehcache.distribution.RMICacheReplicatorFactory"/>
    </cache>

  <cache name="business2Cache"
         maxElementsInMemory="100"
         eternal="true"
         overflowToDisk="false"
         memoryStoreEvictionPolicy="LRU">
         <cacheEventListenerFactory
            class="net.sf.ehcache.distribution.RMICacheReplicatorFactory"/>
    </cache>
          
  
  <!-- cache发布信息配置,人工发现peerDiscovery=manual,cacheNames可配置多个缓存名称,以|分割 ) -->
   <cacheManagerPeerProviderFactory
        class="com.rampage.cache.distribute.factory.DisRMICacheManagerPeerProviderFactory"
        properties="peerDiscovery=manual, cacheNames=business1Cache|business2Cache" />
  
  
  <!-- 接收同步cache信息的地址 -->
 <cacheManagerPeerListenerFactory
        class="com.rampage.cache.distribute.factory.DisRMICacheManagerPeerListenerFactory"
        properties="socketTimeoutMillis=2000" />     
</ehcache>

? spring-cache.xml

<?xml version="1.0" encoding="UTF-8"?>
<beans xmlns="http://www.springframework.org/schema/beans"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xmlns:cache="http://www.springframework.org/schema/cache"
    xmlns:context="http://www.springframework.org/schema/context"
    xmlns:aop="http://www.springframework.org/schema/aop"
    xsi:schemaLocation="http://www.springframework.org/schema/cache http://www.springframework.org/schema/cache/spring-cache.xsd
        http://www.springframework.org/schema/beans http://www.springframework.org/schema/beans/spring-beans.xsd
        http://www.springframework.org/schema/context http://www.springframework.org/schema/context/spring-context-4.2.xsd
        http://www.springframework.org/schema/aop http://www.springframework.org/schema/aop/spring-aop-4.2.xsd"
        default-autowire="byName">
    <!-- 包扫描 -->
    <context:component-scan base-package="com.rampage.cache" />
    <!-- 启用Cache注解 -->
    <cache:annotation-driven cache-manager="cacheManager"
        key-generator="keyGenerator" proxy-target-class="true" />
    <!-- 自定义的缓存key生成类,需实现org.springframework.cache.interceptor.KeyGenerator接口 -->
    <bean id="keyGenerator" class="com.rampage.cache.support.CustomKeyGenerator" />
    <!-- 替换slite的ehcache实现 -->
    <bean id="ehCacheManagerFactory" class="org.springframework.cache.ehcache.EhCacheManagerFactoryBean">
        <property name="configLocation" value="classpath:spring/cache/sppay-ehcache-cache.xml"/>
        <!-- value对应前面ehcache文件定义的manager名称 -->
        <property name="cacheManagerName" value="businessCaches" />
    </bean>
    <bean id="ehCacheManager" class="org.springframework.cache.ehcache.EhCacheCacheManager">
        <property name="cacheManager" ref="ehCacheManagerFactory"/>
    </bean>
    <bean id="cacheManager" class="org.springframework.cache.support.CompositeCacheManager">
        <property name="cacheManagers">
            <list>
                <ref bean="ehCacheManager" />
            </list>
        </property>
        <property name="fallbackToNoOpCache" value="true" />
    </bean>    
</beans>

实现自定义转发和监听

? 细心的读者应该不难发现,前面xml配置中cacheManagerPeerProviderFactorycacheManagerPeerListenerFactory我使用的都是自定义的类。之所以使用自定义的类,是为了在初始化的时候发布的地址和端口,监听的地址端口可以在配置文件配置。具体类的实现如下:

/**
 * 分布式EhCache监听工厂
 * @author secondWorld
 *
 */
public class DisRMICacheManagerPeerListenerFactory extends RMICacheManagerPeerListenerFactory {

    private static final Logger LOGGER = LoggerFactory.getLogger(DisRMICacheManagerPeerListenerFactory.class);
    
    /**
     * 配置文件中配置的监听地址,可以不配置,默认为本机地址
     */
    private static final String LISTEN_HOST = "distribute.ehcache.listenIP";
    
    /**
     * 配置文件中配置的监听端口
     */
    private static final String LISTEN_PORT = "distribute.ehache.listenPort";
    
    @Override
    protected CacheManagerPeerListener doCreateCachePeerListener(String hostName, Integer port,
            Integer remoteObjectPort, CacheManager cacheManager, Integer socketTimeoutMillis) {
        // xml中hostName为空,则读取配置文件(app-config.properties)中的值
        if (StringUtils.isEmpty(hostName)) {
            String propHost = AppConfigPropertyUtils.get(LISTEN_HOST);
            if (StringUtils.isNotEmpty(propHost)) {
                hostName = propHost;
            }
        }
        
        // 端口采用默认端口0,则去读取配置文件(app-config.properties)中的值
        if (port != null && port == 0) {
            Integer propPort = null;
            try {
                propPort = Integer.parseInt(AppConfigPropertyUtils.get(LISTEN_PORT));
            } catch (NumberFormatException e) {
            }
            if (propPort != null) {
                port = propPort;
            }
        }
        
        LOGGER.info(
                "Initiliazing DisRMICacheManagerPeerListenerFactory:cacheManager[{}], hostName[{}], port[{}], remoteObjectPort[{}], socketTimeoutMillis[{}]......",
                cacheManager, hostName, port, remoteObjectPort, socketTimeoutMillis);
        
        return super.doCreateCachePeerListener(hostName, port, remoteObjectPort, cacheManager, socketTimeoutMillis);
    }
}



/**
 * 分布式EhCache发布工厂
 * 
 * @author secondWorld
 *
 */
public class DisRMICacheManagerPeerProviderFactory extends RMICacheManagerPeerProviderFactory {

    private static final Logger LOGGER = LoggerFactory.getLogger(DisRMICacheManagerPeerProviderFactory.class);

    private static final String CACHENAME_DELIMITER = "|";

    private static final String PROVIDER_ADDRESSES = "distribute.ehcache.providerAddresses";

    private static final String CACHE_NAMES = "cacheNames";

    /**
     * rmi地址格式: //127.0.0.1:4447/Cache1|//127.0.0.1:4447/Cache2
     */
    @Override
    protected CacheManagerPeerProvider createManuallyConfiguredCachePeerProvider(Properties properties) {
        // 从app-config.properties中读取发布地址列表
        String providerAddresses = AppConfigPropertyUtils.get(PROVIDER_ADDRESSES, StringUtils.EMPTY);
        // 从ehcache配置文件读取缓存名称
        String cacheNames = PropertyUtil.extractAndLogProperty(CACHE_NAMES, properties);

        // 参数校验,这里发布地址和缓存名称都不能为空
        if (StringUtils.isEmpty(providerAddresses) || StringUtils.isEmpty(cacheNames)) {
            throw new IllegalArgumentException("Elements "providerAddresses" and "cacheNames" are needed!");
        }

        // 解析地址列表
        List<String> cachesNameList = getCacheNameList(cacheNames);
        List<String> providerAddressList = getProviderAddressList(providerAddresses);
        
        // 注册发布节点
        RMICacheManagerPeerProvider rmiPeerProvider = new ManualRMICacheManagerPeerProvider();
        StringBuilder sb = new StringBuilder();
        for (String cacheName : cachesNameList) {
            for (String providerAddress : providerAddressList) {
                sb.setLength(0);
                sb.append("//").append(providerAddress).append("/").append(cacheName);
                rmiPeerProvider.registerPeer(sb.toString());
                LOGGER.info("Registering peer provider [{}]", sb);
            }
        }

        return rmiPeerProvider;
    }

    /**
     * 得到发布地址列表
     * @param providerAddresses 发布地址字符串
     * @return 发布地址列表
     */
    private List<String> getProviderAddressList(String providerAddresses) {
        StringTokenizer stringTokenizer = new StringTokenizer(providerAddresses,
                AppConfigPropertyUtils.APP_ITEM_DELIMITER);

        List<String> ProviderAddressList = new ArrayList<String>(stringTokenizer.countTokens());
        while (stringTokenizer.hasMoreTokens()) {
            String providerAddress = stringTokenizer.nextToken();
            providerAddress = providerAddress.trim();
            ProviderAddressList.add(providerAddress);
        }

        return ProviderAddressList;
    }

    /**
     * 得到缓存名称列表
     * @param cacheNames 缓存名称字符串
     * @return 缓存名称列表
     */
    private List<String> getCacheNameList(String cacheNames) {
        StringTokenizer stringTokenizer = new StringTokenizer(cacheNames, CACHENAME_DELIMITER);

        List<String> cacheNameList = new ArrayList<String>(stringTokenizer.countTokens());
        while (stringTokenizer.hasMoreTokens()) {
            String cacheName = stringTokenizer.nextToken();
            cacheName = cacheName.trim();
            cacheNameList.add(cacheName);
        }

        return cacheNameList;
    }

    @Override
    protected CacheManagerPeerProvider createAutomaticallyConfiguredCachePeerProvider(CacheManager cacheManager,
            Properties properties) throws IOException {
        throw new UnsupportedOperationException("Not supported automatic distribute cache!");
    }
}

配置

? 假设有三台机器,则他们分别得配置如下:

#应用1,在4447端口监听
#缓存同步消息发送地址(如果同步到多台需要配置多台地址,多台地址用英文逗号分隔)
distribute.ehcache.providerAddresses=127.0.0.1:4446,127.0.0.1:4448
#缓存同步监听端口和IP
distribute.ehache.listenPort=4447
distribute.ehcache.listenIP=localhost

#应用2,在4448端口监听
#缓存同步消息发送地址(如果同步到多台需要配置多台地址,多台地址用英文逗号分隔)
distribute.ehcache.providerAddresses=127.0.0.1:4446,127.0.0.1:4447
#缓存同步监听端口和IP
distribute.ehache.listenPort=4448
distribute.ehcache.listenIP=localhost

#应用3,在4446端口监听
#缓存同步消息发送地址(如果同步到多台需要配置多台地址,多台地址用英文逗号分隔)
distribute.ehcache.providerAddresses=127.0.0.1:4447,127.0.0.1:4448
#缓存同步监听端口和IP
distribute.ehache.listenPort=4446
distribute.ehcache.listenIP=localhost

使用

? 使用的时候直接通过Spring的缓存注解即可。简单的示例如下:

@CacheConfig("business1Cache")
@Component
public class Business1 {
    @Cacheable
    public String getData(String key) {
        // TODO:...
    }
}

说明

? 前面的实现是通过RMI的方式来实现缓存同步的,相对来说RMI的效率还是很快的。所以如果不需要实时的缓存一致性,允许少许延迟,那么这种方式的实现足够。


总结

? 到这篇完成,分布式改造的第一章算是告一段落了。对于分布式,如果可以选择,必然要选择现在成熟的框架。但是项目有很多时候,由于各种历史原因,必须要在原来的基础上改造。这个时候,希望我写的这个系列对大家有所帮助。造轮子有时候就是这么简单。


相关链接

以上是关于分布式改造剧集三:Ehcache分布式改造的主要内容,如果未能解决你的问题,请参考以下文章

Docker改造传统应用的流程

Scrapy-redis改造scrapy实现分布式多进程爬取

人人都能看懂系列:《分布式系统改造方案——之数据篇》

springCloud分布式事务实战改造ThemeMicroService 支持分布式事务

springCloud分布式事务实战改造合服务BlockMicroService支持分布式事务

分布式服务下,消息中间件改造