Java性能优化-高速Map存取

余生长醉 提交于 2020-03-01 13:08:52

本博客来自我的新书Java性能优化(暂定名),第5章的Java代码优化技巧节选2,也欢迎阅读我的新书 《Spring Boot 2 精髓 》

5.2 高速Map存取

使用EnumMap来存取Key是Enum的,会有较快的速度,如下是一个网关返回对象Result的的状态属性,是一个枚举类

    public static  enum Status {
      SUCCESS(1,"成功"),FAIL(2,"处理失败"),DEGRADE(98,"成功降级"),UNKOWN(99,"未知异常");

      private int code;
      String msg;
      Status(int code,String msg){
        this.code = code;
        this.msg = msg;
      }

      public int getCode() {
        return code;
      }

      public String getMsg() {
        return msg;
      }
    }

考虑到定义微服务网关返回对象,应该尽量使用java自带类型,以避免各种序列化,反序列化问题,网关不返回此枚举值,而是返回msg字段,因此可以构造一个EnumMap,Key为Status枚举类型,Value为Status.msg 属性

    Map<Status,String> enumMap =null;
    private void initEnumMap(){
      enumMap = new EnumMap<Status,String>(Status.class);
      for(Status status:Status.values()) {
        enumMap.put(status,status.msg);
      }
    }

构造EnumMap的时候,内部实际上通过一个数组保存了所有的枚举值,索引是枚举的ordinal得到 当要根据Enum来操作EnumMap,只需要先调用ordinal,得到其索引,然后直接操作数组即可。操作一维数组有这最快的速度

有些场景下Key是int类型,这时候可以参考第二章的IntMap

有很多Key-Value使用场景,都可以转化为根据索引对数组的存取,我们学过的C语言,操作的是变量名,但实际上还是根据指针获取到内存中的值,Beetl模板语言,对变量的访问,也不像其他脚本语言那样,通过变量名访问Map获取其值,而是在编译期间就为这个变量分配好了索引值,所有变量都保存在一个一维数组里,这样的存取,相比于Map存取,有十倍以上性能提高。

如下一段脚本语言

    var a = 1;
    var b = 2+a;

有些语言引擎会翻译成类似如下java代码

    context.put("a",1);
    context.put("b",context.get("a")+2);

这里context是一个Map。从Map里通过Key存取尽管很快,但是Beetl还是在解析脚本语言的时候给变量设置了数组所在索引,因此如上脚本在Beetl中翻译如下

    Object[] vars = context.vars;
    vars[0] =1 ;
    vars[1] = vars[0]+2

这里为变量a,b 分别设置了在变量表中的索引是0和1;

曾优化过一个电商的基础组件,电商系统每天调用这个组件的次数高达10+万亿次,这个组件是用来统计方法调用的时长,收集一段时间后,定期发送到 分析系统,用于查找和分析方法的性能,其中有一部分代码是记录以调用时长分类,记录条用次数,下面的代码

    Watch watch = Watch.instance("orderByWx"); //初始化,从微信来的订单
    //调用其他业务逻辑.....
    Profile.add(watch.endWatch());//记录一次

Watch类定义如下

    public class Watch {
      String key;
      long start;
      long millis =-1;
      private Watch(String key){
        this.key = key;
        this.start = System.nanoTime();
      }
      public static Watch instance(String key){
        return new Watch(key);
      }

      public Watch endWatch(){
        millis = millisConsume();
        return this;
      }

      /**
       * 返回方法调用消耗的毫秒
       * [@return](https://my.oschina.net/u/556800)
       */
        private long millisConsume(){
          return  TimeUnit.NANOSECONDS.toMillis(System.nanoTime()-start);
        }

    }

Watch的key属性记录调用类型,如订单调用,商品查询信息等,可以为任意值,start属性记录了调用时候的时间点,millis会在调用endWatch后记录调用消耗的毫秒数。

Profile类用来记录监控信息,并通过其他后台线程发送到性能分析中心,例子做了一定简化,只呈现保存部分

    public class Profile {
      //调用时长和调用次数
      static Map<Integer, AtomicInteger> countMap = new ConcurrentHashMap<>();
      /**
       * 对调用时间计数
       * [@param](https://my.oschina.net/u/2303379) watch
       */
      public static void addWatch(Watch watch){
        int consumeTime = (int)watch.millis;
        AtomicInteger  count  = countMap.get(consumeTime);
        if(count==null){
          count = new AtomicInteger();
          AtomicInteger old  = countMap.putIfAbsent(consumeTime,count);
          if(old!=null){
            count = old;
          }
        }
        count.incrementAndGet();
      }
    }

Profile会初始化一个ConcurrentHashMap用于计数,Key为Integer类型,表示调用时长,Value为AtomicInteger,用来计数,每次调用,都会自增一个

Profile性能有一点优化空间,如果从业务角度考虑,大部分需要监控的方法或者代码块,执行时间并不长,假设不超过32毫秒(这是一个假设值,根据系统运维统计分析后得出),因此,可以考虑用一个32长度的数组来存放32毫秒以内的所有计数,超过32毫秒的再沿用以前的方法

    static Map<Integer, AtomicInteger> countMap = new ConcurrentHashMap<>();
    static final int MAX  = 32;
    //保存消耗时间为32毫秒的调用次数
    static AtomicInteger[] counts = new AtomicInteger[MAX];
    static{
        for(int i=0;i<MAX;i++){
            counts[i] = new  AtomicInteger();
        }
    }

    /**
    * 对调用时间计数
    * [@param](https://my.oschina.net/u/2303379) watch
    */
    public static void addWatch(Watch watch){
        int consumeTime = (int)watch.millis;
        if(consumeTime<MAX){
            counts[consumeTime].incrementAndGet();
            return ;
        }
        AtomicInteger  count  = countMap.get(consumeTime);
        //原有的Profile.addWatch逻辑,在此忽略

    }

新完善的代码使用counts数组记录32毫秒以内调用计数,因此当addWatch被调用的时候,先判断millis是否小于32毫秒,如果是,直接用数组获取计数器,然后自增。否则,沿用以前的逻辑

优化后,通过JMH测试(com.ibeetl.code.ch05.WatchTest),性能略有提升,如下输出:

    Benchmark                     Mode  Samples      Score  Score error   Units
    c.i.c.c.WatchTest.better     thrpt       20  16447.171     2195.344  ops/ms
    c.i.c.c.WatchTest.general    thrpt       20  11566.545      601.579  ops/ms

性能优化提高了40%,尽管看着不如本书其他例子性能提升那么明显,但考虑这是一个基础工具,性能提升会对所有系统都有帮助,实际上,作者优化为跟此性能监控工具后,对业务系统的有提升5%的性能提升,在拥有数十万台服务器的大型电商系统,这个系统提升还是有意义的。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!