JDBC PreparedStatement 批量查询 in 的实现方案

Posted 2020-11-12

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了JDBC PreparedStatement 批量查询 in 的实现方案相关的知识，希望对你有一定的参考价值。

我们经常会有这种业务需求，根据一个条件集合去查询一张表的数据，比如：
select * from tablename t where t.name in (List <taskids>);
在java语言中，我们需要用到JDBC来和数据库打交道，那么在JDBC中该如何处理这种需求呢？我们可以有如下几种处理方式

方案一：写一个函数把参数集合转换成一个or 条件或 in 条件的字符串，最后拼成一个sql

select from tablename t where t.name in (‘123‘ ,‘456‘, ‘789‘);
或者是：
select from tablename t where t.name=‘123‘ or t.name= ‘456‘ t.name= ‘789‘;

但是这样效率如何呢？我们知道Oracle对传过来的SQL是需要事先编译的，不过是Oracle有个缓存功能可以缓存编译好的SQL,但前提是传过来的SQL必须完全一致，很明显，如果按照以上方式的话，一旦taskid值变化，那么Oracle的缓存便无法利用。

方案二：使用预编译的PrepareStatement

为了解决Oracle缓存无法利用问题，Jdbc提供了预编译的PrepareStatement，对于变化的参数可以用占位符 <?> 来代替，因此我们可以用占位符来减少Oracle编译次数。
    private static final String QUERY = "select * from tablename where name= ?";
      ps = con .prepareStatement(QUERY);
      for(String name : taskIds){
         ps.setString(1,name);
         rs = ps .executeQuery();
      }
这样做虽然可以很好的利用Oracle的缓存，但缺点也很明显，就是每一个Id都需要查询数据库一次，这样效率是极低的。

方案三：动态地创建PrepareStatement

虽然变化的参数可以用占位符 <?> 来代替,然而遗憾的是Jdbc只提供了单一占位符功能即占位符不能是一个可迭代的集合。因此，对于我们传过来的集合参数，我们可以动态地创建一个PrepareStatement：

拼一个和集合大小相等数量占位符的SQL，再写一个循环来赋值每一个占位符，这样就可以解决taskId的值变化而导致Oracle重新编译SQL问题。
private static void createQuery(List<String> taskIds) {
      String query = "select * from tablename t where t.name in (";
      StringBuilder queryBuilder = new StringBuilder(query);
       for ( int i = 0; i < taskIds.size(); i++) {
          queryBuilder.append( " ?");
           if (i != taskIds.size() - 1)
               queryBuilder.append( ",");
      }
      queryBuilder.append( ")");
       ps = con .prepareStatement(query);
       for ( int i = 1; i <= taskIds.size(); i++) {
           ps.setString(i, taskIds.get(i - 1).toString());
      }
       rs = ps .executeQuery();
 }
但是这么做还是存在一个问题，如果集合的值变化不会导致Oracle重新编译，但是如果集合的大小发生变化，相对应的SQL也就发生了变化，同样也会导致Oracle重新编译，那么该如何解决这个问题呢？

方案四：批量查询（减少查询次数并利用到Oracle缓存）

批量查询兼顾了第二、第三种方案，其思想是预先定义好几个每次要查询参数的个数，然后把参数集合按这些定义好的值划分成小组。比如我们的前台传过来一个数量为75的taskId的集合，我预定义的批量查询参数的个数分别为：
SINGLE_BATCH = 1;//注意：为了把参数集合完整划分，这个值为1的批量数是必须的
SMALL_BATCH = 4;
MEDIUM_BATCH = 11;
LARGE_BATCH = 51;

那么我们第一次会查询51条数据，还剩下24个没有查询，那么第二次批量查询11条数据，还剩下13条未查询，第三次再批量查询11条数据，最后还剩2条未查询，那么我们再分两批次，每批次仅查询一条，这样，最终一个75条的数据分5批次即可查询完成，减少了查询次数，而且还利用到了数据库缓存。附获取批量的算法：
 public static final int SINGLE_BATCH = 1; //注意：为了把参数集合完整划分，这个值为1的批量数是必须的
  public static final int SMALL_BATCH = 4;
  public static final int MEDIUM_BATCH = 11;
  public static final int LARGE_BATCH = 51;
  static int totalNumberOfValuesLeftToBatch=75;
  public static List<Integer>  getBatchSize( int totalNumberOfValuesLeftToBatch){
      List<Integer> batches= new ArrayList<Integer>();
       while ( totalNumberOfValuesLeftToBatch > 0 ) {
           int batchSize = SINGLE_BATCH;
           if ( totalNumberOfValuesLeftToBatch >= LARGE_BATCH ) {
            batchSize = LARGE_BATCH;
          } else if ( totalNumberOfValuesLeftToBatch >= MEDIUM_BATCH ) {
            batchSize = MEDIUM_BATCH;
          } else if ( totalNumberOfValuesLeftToBatch >= SMALL_BATCH ) {
            batchSize = SMALL_BATCH;
          }
          batches.add(batchSize);
          totalNumberOfValuesLeftToBatch -= batchSize;
          System. out.println(batchSize);
      }
       return batches;
 }

以上是关于JDBC PreparedStatement 批量查询 in 的实现方案的主要内容，如果未能解决你的问题，请参考以下文章

JDBC批量插入性能简单分析

jdbc批量插入实现大批量数据快速插入

PreparedStatement批量(batch)插入数据

JDBC中Statement与PreparedStatement的区别

MYSQL 之 JDBC： PreparedStatement

JDBC的批量添加

JDBC PreparedStatement 批量查询 in 的实现 方案

JDBC PreparedStatement 批量查询 in 的实现方案