对Java Serializable（序列化）的理解和总结

Posted 2021-01-25 zhuhui-site

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了对Java Serializable（序列化）的理解和总结相关的知识，希望对你有一定的参考价值。

导读：最近在做项目的过程中，发现一个问题，就是我们最开始的时候，传递参数包括返回类型，都有map类型。但是由于map每次都要匹配key值，很麻烦。所以在之后就将参数传递和返回类型全都改成了实体bean，并且让每个bean都实现了Serializable接口。然后，在这里的时候，就有点疑惑。首先：为什么要进行序列化；其次：每个实体bean都必须实现serializabel接口吗？最后：我做一些项目的时候，没有实现序列化，同样没什么影响，然后现在做项目需要序列化，到底什么时候应该进行序列化操作呢？

本篇文章，是我对于序列化这个话题的一点小小的思考，可能还不太成熟，请每一个路过的人不吝赐教，在此，先谢过了！

一、什么是序列化

In computer science, in the context of data storage, serialization is the process of translating data structures or object state into a format that can be stored (for example, in a file or memory buffer, or transmitted across a network connection link) and reconstructed later in the same or another computer environment.[1] When the resulting series of bits is reread according to the serialization format, it can be used to create a semantically identical clone of the original object.

那我也有看过很多的博客包括书，但是我之前其实一直不太理解这个序列化，虽然一直都在用。今天在看资料的时候，发现导致这种现象的原因，可能是我之前看的一些介绍里面，忽略了一个很关键的因素：object state info对象的状态信息。也就是说，其实序列化，它是完整的保存了某一状态下的对象信息，是一个整体，而不是零散的！我在一个IBM工程师的博客里面看到一个说法，我感觉对于我理解序列化很有帮助，他说序列化的过程，就是一个“freeze”的过程，它将一个对象freeze住，然后进行存储，等到再次需要的时候，再将这个对象de-freeze就可以立即使用。

二、为什么需要序列化

1，存储对象在存储介质中，以便在下次使用的时候，可以很快捷的重建一个副本。也就是When the resulting series of bits is reread according to the serialization format, it can be used to create a semantically identical clone of the original object.

问题：我没有实现序列化的时候，我一样可以存入到我的sqlserver或者mysql、Oracle数据库中啊，为什么一定要序列化才能存储呢？？？？

2，便于数据传输，尤其是在远程调用的时候！

三、到底什么时候一定要序列化

结合到第二点的问题，就是说在我存储的时候，不通过序列化也一样完美存储，为什么要多此一举？额，经过我阅读文档和书籍，以及做项目的经验总结（反正就是之前混迹在编码中的一系列经验总结），在存储时需要序列化，这是肯定的。大家知道的是序列化是将对象进行流化存储，我们有时候感觉自己在项目中并没有进行序列化操作，也一样是存进去了，那么对象需要经过序列化才能存储的说法，似乎从这儿就给阉割了。事实究竟是怎样的呢？

首先看我们常用的数据类型类声明：

public final class String implements java.io.Serializable, Comparable<String>, CharSequence

public class Date implements java.io.Serializable, Cloneable, Comparable

而像其他int、long、boolean类型等，都是基本数据类型，数据库里面有与之对应的数据结构。从上面的类声明来看，我们以为的没有进行序列化，其实是在声明的各个不同变量的时候，由具体的数据类型帮助我们实现了序列化操作。

拿到这儿的时候，就又有一个问题，既然实体类的变量都已经帮助我们实现了序列化，为什么我们仍然要显示的让类实现serializable接口呢？

请注意我以上的说法：首先，序列化的目的有两个，第一个是便于存储，第二个是便于传输。我们一般的实体类不需要程序员再次实现序列化的时候，请想两个问题：第一：存储媒体里面，是否是有其相对应的数据结构？第二：这个实体类，是否需要远程传输（或者两个不同系统甚至是分布式模块之间的调用）？

如果有注意观察的话，发现序列化操作用于存储时，一般是对于NoSql数据库，而在使用Nosql数据库进行存储时，用“freeze”这个说法来理解是再恰当不过了，请在NoSql数据库中，给我找出个varchar，int之类的数据结构出来？如果没有，但我们又确实需要进行存储，那么，此时程序员再不将对象进行序列化，更待何时？

备注：如果有人打开过Serializable接口的源码，就会发现，这个接口其实是个空接口，那么这个序列化操作，到底是由谁去实现了呢？其实，看一下接口的注释说明就知道，当我们让实体类实现Serializable接口时，其实是在告诉JVM此类可被序列化，可被默认的序列化机制序列化。

然后，需要说明的是，当我们在实体类声明实现Serializable接口时，再次进行观察，会发现这些类是需要被远程调用的。也就是说需要或者可能需要被远程调用，这就是序列化便于传输的用途。

慎重声明：以上所有言论，都是本宝宝经过项目中的具体观察，以及阅读一些文章之后的所谓经验之谈，且看且见谅吧！

三、是否一定要实现Serializable接口序列化

上回说到了关于序列化的一些基本情况，那么，接下来的一个问题是：如果我们要实现序列化操作，是否一定要通过实现Serializable接口的方式？PS：其实，我只是不明白，为什么大家一提到序列化就说特别简单，实现Serializable接口就OK了？我就一直在想，这是否是目前我们所能拥有的最佳选择？

请大家先看一篇文章分析：https://github.com/eishay/jvm-serializers/wiki

文章说得很清楚，图文并茂的，那么多选择，自己看着办吧。不过我最近做的一个项目使用的是protostuff！

四、使用其他序列化实现的优缺点

诚如大家在第三节分享的链接文章所见，通过实现Serializable接口的方式去进行序列化操作，在性能上来讲并不是最佳选择。那么，在性能考虑的情况下，很多人都会选择其他更为高效率的产品替代serializable接口，现在问题来了：

1，如果我通过Serializable接口实现，那么我只需要在类声明时实现它即可

2，如果我通过其他方式实现，那么我将不得不自己重写工具类，不能再通过实现serializable接口的方式去进行序列化了。在使用上，大大的不怎么方便！

PS：项目中总会用到个什么redis，mongoDB啥的，其实每次存取都有那么一个数据封装处理的过程，额，也差不了这一点了。那么有没有现成的人家封装好的呢？自己找吧，肯定是有的。其实，我就是不明白，如果是用了第三方的工具去实现序列化，那么在序列化进行远程调用的时候，到底应该在哪儿进行显示的序列化或者反序列操作？我刚开始想在Dao层，但这样子的话，自己模块操作不也得来那么一波序列化反序列化操作嘛。因为我目前确实只是在从NoSql数据库中存取数据时用到了第三方的序列化工具，而在远程调用的时候，没有啊！以前都是直接实现Serializable接口的，唉。。。。学艺不精啊！

跪求指点！！！！！

五、总结

其实，很长的一段时间里，我一直以为java底层包自带的方法一定会是最好的，包括各个框架，我都更愿意去用它本身就有的工具。但是，可能那些自带的方法，尤其是向Serializable接口，从jdk1.1开始就有了，经过了长时间的考验，性能上可能不是最好的，但它的稳定性绝对是值得肯定的。那么，其实在使用的时候，还是根据自身的情况考虑吧。在技术乃至于架构或者说各种系统设计，最实用最适合的，才是最好了！

其实我还有一个问题，不见得自己模块会和数据库部署到同一个机器上啊，所以还是得考虑都传输时的序列化问题，那如果使用第三方的工具，不都得来那么一波嘛，这代码量就又活生生的多了那么点儿。唉，不说了，我这是越说越晕，回家吃饭！

以上是关于对Java Serializable（序列化）的理解和总结的主要内容，如果未能解决你的问题，请参考以下文章