[生产库实战] 采用存储过程对生产线历史表数据进行归档

Posted 2020-07-19

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了[生产库实战] 采用存储过程对生产线历史表数据进行归档相关的知识，希望对你有一定的参考价值。

生产线历史数据归档是数据库运维的一项日常基本工作。在建表设计时，通常都将数据流水表（如：日志、用户登录历史，软件下载记录，用户属性更改历史表等）设计为范围分区表、间隔分区表（11G），当超过业务要求的保留范围时，此数据基本是静态数据且应用程序再不对其进行访问，但有可能会由于某些特殊要求需要手动查询。在这个情况下，都将其数据从生产库归档至历史库，并对其进行压缩保存，如果超出特殊要求查询的范围，那就直接将其导出压缩备份到磁带。

在Oracle数据库中，用做表数据归档操作的方法很多，如：exp/imp、expdp/impdp、传输表空间等方法，这些都是日常数据库维护可能使用到的，这些工具的使用方法这里不展开了，下面进入今天的主题，使用存储过程归档生产线历史表数据，先对其简单做下总结：

1、简单，不容易出错；

2、对其源库（这里就是生产库）来说，就是一条select查询语句，性能影响小；

3、数据从源库到目标库不需要落地，和dblink+impdp迁移数据的方法类似，节约导出数据所需空间（上百GB的表）及归档时间；

4、可监控其归档进度及归档记录数；

5、如果是跨机房传输，请监控好网络带宽流量。

6、......

操作流程：

1、在生产库维护用户的Schema下创建一张视图，视图中包含需要归档的表的分区：

create view log_table_p201209
as
select * from user01.log_table partition(P201209);

注：为什么要建视图？因为通过dblink查询不能用 select * from table partition (partition_name).....这样的语句。

2、在历史库放归档数据的用户下（历史库操作都下面都在此用户下操作）创建数据归档状态表及序列

-- Create table
create table data_archive_status
(
id   NUMBER,
threadno   NUMBER,
table_name VARCHAR2(60),
syncnum    NUMBER,
state      NUMBER,
starttime DATE,
synctime   DATE,
remark     VARCHAR2(2000)
);
-- Add comments to the columns
comment on column data_archive_progress.state
is ‘0:开始，1：打开、解析游标，2：提取数据，3：某个表同步完成，4：所有表全部完成，其他负数：错误编码‘;

-- Create sequence
create sequence seq_id
minvalue 1
maxvalue 9999999999999
start with 1
increment by 1
cache 20;

3、在历史库创建一个可以通过只读权限连接生产库的dblink，示例:

-- Create database link
create database link XXDB.LOCALDOMAIN
connect to readonly
identified by ""
using ‘(DESCRIPTION=
    (LOAD_BALANCE=no)
    (ADDRESS_LIST=
      (ADDRESS=
        (PROTOCOL=TCP)
        (HOST=172.16.XX.XX)
        (PORT=1521)
      )
      (ADDRESS=
        (PROTOCOL=TCP)
        (HOST=172.16.XX.XX)
        (PORT=1521)
      )
    )
    (CONNECT_DATA=
      (FAILOVER_MODE=
        (TYPE=select)
        (METHOD=basic)
        (RETRIES=180)
        (DELAY=5)
      )
      (SERVER=dedicated)
      (SERVICE_NAME=XX_service)
    )
)‘;

4、历史库创建一张与生产库相同表结构的表，表名建议改为带上归档数据标识

create tabel log_table_p201209（......）;

5、创建用于数据归档的存储过程：

create procedure p_log_table_p201209 as
--索引表
type u_type is table of log_table_p201209%rowtype index by pls_integer;
v_list u_type;
--定义数组，存放待同步的视图名称。
type varchar_arrary is table of varchar2(60) index by pls_integer;
v_remoteview_list varchar_arrary;
--定义一个引用索引
type cur_ref is ref cursor;
cur_data cur_ref;
--本地变量，记录SQL%ROWCOUNT
v_counter number := 0;
v_rowid    rowid;
v_sqlcode varchar2(300) := null;
v_querystr varchar(1000) := null;
v_parse_elapsed_s date := null;
v_parse_elapsed_e date := null;
v_fetch_elapsed_s date := null;
v_fetch_elapsed_e date := null;
begin
--初始化数组（第1步中创建的视图）
v_remoteview_list(1) := ‘zhanghui.log_table_p201209‘;
--循环同步每个分区表
for k in 1 .. v_remoteview_list.count loop
    --添加一个同步任务记录
    insert into data_archive_status
    values
      (seq_id.nextval,
       k,
       v_remoteview_list(k),
       0,
       0,
       sysdate,
       sysdate,
       null)
    returning rowid into v_rowid;
    commit;
    v_querystr := ‘select /*+ rowid(t) */ * from ‘ || v_remoteview_list(k) ||
                  ‘@XXDB.LOCALDOMAIN t‘;
    update data_archive_status t
       set t.synctime = sysdate, t.state = 1
     where rowid = v_rowid;
    commit;
    --记录打开、解析游标的时间长度。
    v_parse_elapsed_s := sysdate;
    open cur_data for v_querystr;
    v_parse_elapsed_e := sysdate;
    update data_archive_status
       set synctime = sysdate,
           state    = 2,
           remark   = remark || ‘[‘ || v_remoteview_list(k) ||
                      ‘:parse_elapsed=‘ ||
                      (v_parse_elapsed_e - v_parse_elapsed_s) || ‘sec,‘
     where rowid = v_rowid;
    commit;
    v_counter         := 0;
    v_fetch_elapsed_s := sysdate;
    --对打开的游标，进行循环同步。
    loop
      --使用Bulk Binding，一次处理10000条记录
      fetch cur_data bulk collect
        into v_list limit 10000;
      forall i in 1 .. v_list.last
        insert into log_table_p201209
        values v_list
          (i);
      --记录当前同步的记录数
      v_counter := v_counter + sql%rowcount;
      update data_archive_status t
         set t.syncnum = v_counter, t.synctime = sysdate
       where rowid = v_rowid;
      commit;
      exit when cur_data%notfound;
    end loop;
    v_fetch_elapsed_e := sysdate;
    --更新进度表,将当前分区完成时间记录到备注中。
    update data_archive_status
       set state    = 3,
           synctime = sysdate,
           remark   = remark || ‘fetch_elapsed=‘ ||
                      round((v_fetch_elapsed_e - v_fetch_elapsed_s) * 24 * 60,
                            4) || ‘min,syncnum=‘ || v_counter ||
                      ‘,endtime= ‘ || to_char(sysdate, ‘yyyymmddhh24miss‘) || ‘]‘
     where rowid = v_rowid;
    commit;
    close cur_data;
    --更新进度表
    update data_archive_status t set t.state = 4 where rowid = v_rowid;
    commit;
end loop;
exception
when others then
    v_sqlcode := sqlcode;
    update data_archive_status
       set synctime = sysdate, state = v_sqlcode
     where rowid = v_rowid;
    commit;
    raise;
end;

6、创建压缩对象存储过程，由于move操作需要接近双倍的存储空间，所以压缩前请提前评估空间需求

create procedure p_compress_object(vObject_name    varchar2, --对象
vPartition_name varchar2 default null, --分区名
vParallel       int default 0, --并行度
vPctfree        int default 0, --存储参数pctfree 不再考虑DML操作的设置为0
vTablespace     varchar2 default null, --表空间
vOwner          varchar2 default user, --对象拥有者
vType           number --类型:0、table 1、index 2、 partition table 3、index partition
                                              ) Authid Current_User is
vSql     varchar2(4000);
vSqlerrm varchar2(256);
v_sqlstring varchar2(4000);
begin
v_sqlstring := ‘alter session set db_file_multiblock_read_count=128‘;
    execute immediate v_sqlstring;
if vType = 0 then
    begin
      vSql := ‘alter table ‘ || vOwner || ‘.‘ || vObject_name || ‘ move ‘ || case when vTablespace is null then null else ‘tablespace ‘ || vTablespace end || ‘ pctfree ‘ || vPctfree || ‘ compress nologging ‘ || case when vParallel in (0, 1) then null else ‘parallel ‘ || vParallel end;
      execute immediate vSql;
    end;
elsif vType = 1 then
    begin
      vSql := ‘alter index ‘ || vOwner || ‘.‘ || vObject_name ||
              ‘ rebuild ‘ || case when vTablespace is null then null else ‘tablespace ‘ || vTablespace end || ‘ pctfree ‘ || vPctfree || ‘ compress nologging ‘ || case when vParallel in (0, 1) then null else ‘parallel ‘ || vParallel end;
      execute immediate vSql;
    end;
elsif vType = 2 then
    begin
      vSql := ‘alter table ‘ || vOwner || ‘.‘ || vObject_name ||
              ‘ move partition ‘ || vPartition_name || case when vTablespace is null then null else ‘ tablespace ‘ || vTablespace end || ‘ pctfree ‘ || vPctfree || ‘ compress nologging ‘ || case when vParallel in (0, 1) then null else ‘parallel ‘ || vParallel end;
      execute immediate vSql;
    end;
elsif vType = 3 then
    begin
      vSql := ‘alter index ‘ || vOwner || ‘.‘ || vObject_name ||
              ‘ rebuild partition ‘ || vPartition_name || case when vTablespace is null then null else ‘ tablespace ‘ || vTablespace end || ‘ pctfree ‘ || vPctfree || ‘ compress nologging ‘ || case when vParallel in (0, 1) then null else ‘parallel ‘ || vParallel end;
      execute immediate vSql;
    end;
end if;
exception
when others then
    vSqlerrm := sqlerrm;
    dbms_output.put_line(vSqlerrm||‘|‘||vSql);
end;

7、上述工作准备完成，确认历史库表空间情况，调用数据归档存储过程 p_log_table_p201209 ，处理完成后对数据进行压缩，调用存储过程 p_compress_object（....）；

8、确认数据无误，drop掉生产库维护用户对应的视图及业务表的分区，释放对象占用空间（注意：检查分区表的索引是否为local，否则就.....）.

以上......完！

以上是关于[生产库实战] 采用存储过程对生产线历史表数据进行归档的主要内容，如果未能解决你的问题，请参考以下文章

logminer实战之生产环境写入数据字典，dg环境查询拷贝日志，测试环境进行挖掘，输出结果

mysql 生产库大表delete

SQLserver 2008同步复制创建后新增表/函数/存储过程(不重新初始化快照)

[生产库实战] 如何合理的使用logmnr进行日志挖掘，并对生产库影响最小化

华为云服务器mysql数据恢复过程

交通流量预测，EasyDL带你零代码实战