spark 大型项目实战:用户访问session分析 --数据库连接池原理

Posted haha174

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spark 大型项目实战:用户访问session分析 --数据库连接池原理相关的知识,希望对你有一定的参考价值。

**文章地址:http://www.haha174.top/article/details/257789**
1.谈谈数据库连接池的原理
-------------
这次我们采取技术演进的方式来谈谈数据库连接池的技术出现过程及其原理,以及当下最流行的开源数据库连接池jar包。

一.早期我们怎么进行数据库操作
技术分享图片
1.原理:一般来说,java应用程序访问数据库的过程是:

  ①装载数据库驱动程序;

  ②通过jdbc建立数据库连接;

  ③访问数据库,执行sql语句;

  ④断开数据库连接。

2.代码

       Public void FindAllUsers(){
              //1、装载sqlserver驱动对象
            Class.forName("com.mysql.jdbc.Driver");
              //2、通过JDBC建立数据库连接
              Connection con =DriverManager.getConnection("jdbc:mysql://localhost:3306/test?&useUnicode=true&characterEncoding=utf-8&failOverReadOnly=false", "root", "root");          
              //3、创建状态
              Statement state =con.createStatement();           
              //4、查询数据库并返回结果
              ResultSet result =state.executeQuery("select * from users");           
              //5、输出查询结果
              while(result.next()){
                     System.out.println(result.getString("username"));
              }            
              //6、断开数据库连接
              result.close();
              state.close();
              con.close();
        }

3.分析

程序开发过程中,存在很多问题:首先,每一次web请求都要建立一次数据库连接。建立连接是一个费时的活动,每次都得花费0.05s~1s的时间,而且系统还要分配内存资源。这个时间对于一次或几次数据库操作,或许感觉不出系统有多大的开销。可是对于现在的web应用,尤其是大型电子商务网站,同时有几百人甚至几千人在线是很正常的事。在这种情况下,频繁的进行数据库连接操作势必占用很多的系统资源,网站的响应速度必定下降,严重的甚至会造成服务器的崩溃。不是危言耸听,这就是制约某些电子商务网站发展的技术瓶颈问题。其次,对于每一次数据库连接,使用完后都得断开。否则,如果程序出现异常而未能关闭,将会导致数据库系统中的内存泄漏,最终将不得不重启数据库。还有,这种开发不能控制被创建的连接对象数,系统资源会被毫无顾及的分配出去,如连接过多,也可能导致内存泄漏,服务器崩溃。

上述的用户查询案例,如果同时有1000人访问,就会不断的有数据库连接、断开操作:
技术分享图片
通过上面的分析,我们可以看出来,“数据库连接”是一种稀缺的资源,为了保障网站的正常使用,应该对其进行妥善管理。其实我们查询完数据库后,如果不关闭连接,而是暂时存放起来,当别人使用时,把这个连接给他们使用。就避免了一次建立数据库连接和断开的操作时间消耗。原理如下:
技术分享图片
二. 技术演进出来的数据库连接池

由上面的分析可以看出,问题的根源就在于对数据库连接资源的低效管理。我们知道,对于共享资源,有一个很著名的设计模式:资源池(resource pool)。该模式正是为了解决资源的频繁分配﹑释放所造成的问题。为解决上述问题,可以采用数据库连接池技术。数据库连接池的基本思想就是为数据库连接建立一个“缓冲池”。预先在缓冲池中放入一定数量的连接,当需要建立数据库连接时,只需从“缓冲池”中取出一个,使用完毕之后再放回去。我们可以通过设定连接池最大连接数来防止系统无尽的与数据库连接。更为重要的是我们可以通过连接池的管理机制监视数据库的连接的数量﹑使用情况,为系统开发﹑测试及性能调整提供依据。
欢迎关注,更多福利
----
技术分享图片













以上是关于spark 大型项目实战:用户访问session分析 --数据库连接池原理的主要内容,如果未能解决你的问题,请参考以下文章

spark 大型项目实战:用户访问session分析 --数据库连接池原理

Spark大型电商项目实战-及其改良 比对sparkSQL和纯RDD实现的结果

[Spark/Scala] 180414|大数据实战培训 Spark大型项目实战:电商用户行为分析大数据平台 大数据视频教程

spark项目实战(一~~九)

Spark实战--寻找5亿次访问中,访问次数最多的人

基于spark和flink的电商数据分析项目