为什么老程序员从不使用 Java 自带的序列化?

Posted 业余草

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了为什么老程序员从不使用 Java 自带的序列化?相关的知识,希望对你有一定的参考价值。

你知道的越多,不知道的就越多,业余的像一棵小草!

成功路上并不拥挤,因为坚持的人不多。

编辑:业余草

cnblogs.com/rickiyang/p/11074232.html

推荐:https://www.xttblog.com/?p=5221

谈到序列化我们自然想到 Java 提供的 Serializable 接口,在 Java 中我们如果需要序列化只需要继承该接口就可以通过输入输出流进行序列化和反序列化。

「但是在提供很用户简单的调用的同时他也存在很多问题:」

无法跨语言

当我们进行跨应用之间的服务调用的时候如果另外一个应用使用 c 语言来开发,这个时候我们发送过去的序列化对象,别人是无法进行反序列化的因为其内部实现对于别人来说完全就是黑盒。

序列化之后的码流太大

这个我们可以做一个实验还是上一节中的 Message 类,我们分别用 java 的序列化和使用二进制编码来做一个对比,下面我写了一个测试类:

@Test  
public void testSerializable(){  
    String str = "哈哈,我是一条消息";  
    Message msg = new Message((byte)0xAD,35,str);  
    ByteArrayOutputStream out = new ByteArrayOutputStream();  
    try {  
        ObjectOutputStream os = new ObjectOutputStream(out);  
        os.writeObject(msg);  
        os.flush();  
        byte[] b = out.toByteArray();  
        System.out.println("jdk序列化后的长度: "+b.length);  
        os.close();  
        out.close();

        ByteBuffer buffer = ByteBuffer.allocate(1024);  
        byte[] bt = msg.getMsgBody().getBytes();  
        buffer.put(msg.getType());  
        buffer.putInt(msg.getLength());  
        buffer.put(bt);  
        buffer.flip();

        byte[] result = new byte[buffer.remaining()];  
        buffer.get(result);  
        System.out.println("使用二进制序列化的长度:"+result.length);

    } catch (IOException e) {  
        e.printStackTrace();  
    }  
}

输出结果为:

我们可以看到差距是挺大的,目前的主流编解码框架序列化之后的码流也都比 java 序列化要小太多。

序列化效率

这个我们也可以做一个对比,还是上面写的测试代码我们循环跑 100000 次对比一下时间:

@Test  
public void testSerializable(){  
    String str = "哈哈,我是一条消息";  
    Message msg = new Message((byte)0xAD,35,str);  
    ByteArrayOutputStream out = new ByteArrayOutputStream();  
    try {  
        long startTime = System.currentTimeMillis();  
        for(int i = 0;i < 100000;i++){  
            ObjectOutputStream os = new ObjectOutputStream(out);  
            os.writeObject(msg);  
            os.flush();  
            byte[] b = out.toByteArray();  
            /*System.out.println("jdk序列化后的长度: "+b.length);*/  
            os.close();  
            out.close();  
        }  
        long endTime = System.currentTimeMillis();  
        System.out.println("jdk序列化100000次耗时:" +(endTime - startTime));

        long startTime1 = System.currentTimeMillis();  
        for(int i = 0;i < 100000;i++){  
            ByteBuffer buffer = ByteBuffer.allocate(1024);  
            byte[] bt = msg.getMsgBody().getBytes();  
            buffer.put(msg.getType());  
            buffer.putInt(msg.getLength());  
            buffer.put(bt);  
            buffer.flip();

            byte[] result = new byte[buffer.remaining()];  
            buffer.get(result);  
            /*System.out.println("使用二进制序列化的长度:"+result.length);*/  
        }  
        long endTime1 = System.currentTimeMillis();  
        System.out.println("使用二进制序列化100000次耗时:" +(endTime1 - startTime1));

    } catch (IOException e) {  
        e.printStackTrace();  
    }  
}

结果为:

结果为毫秒数,这个差距也是不小的。

总结

目前的序列化过程中使用 Java 本身的肯定是不行,使用二进制编码的话又的我们自己去手写,所以为了让我们少搬砖前辈们早已经写好了工具让我们调用,目前社区比较活跃的有 google 的 Protobuf 和 Apache 的 Thrift。

以上是关于为什么老程序员从不使用 Java 自带的序列化?的主要内容,如果未能解决你的问题,请参考以下文章

JVM内存:年轻代老年代永久代(推荐 转)

Java堆内存中为什么有两个survival区及为什么与年轻代比例是1:1:8?

GC 年轻代 老年代 持久代

JAVA垃圾回收期 老年代和新生代是啥意思

JVM 年轻代 老年代 持久代 gc

jvm如何gc,新生代,老年代,持久代,都存储哪些东西