PostgreSQL 逻辑复制学习中的深入与疑问

Posted 2022-06-10 wx5c241fe5127d0

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了PostgreSQL 逻辑复制学习中的深入与疑问相关的知识，希望对你有一定的参考价值。

PostgreSQL

之前的两篇文字都是基于操作方面的，POSTGRESQL 逻辑复制的原理其实还是不大懂的，但学习任何一个东西虽然入手可以通过操作入手，但如果原理不懂，仅仅停留在操作层面那就.......

首先逻辑复制早期在 PG 10 之前是通过插件的方式来实现其功能的，在PG10合并进数据库系统中。

逻辑复制主要解决的问题（是物理复制不能，或很难解决的问题）

1 表级别的复制

2 主从数据表的结构有条件的不一致

3 复制的数据进行过滤，仅仅复制 INSERT ，或者 UPATE 等操作

4 同cluster 中的不同库的的数据复制到另一个库中

如果说物理复制解决的是数据同步，数据库高可用，读写分离这方面的事情。逻辑复制应该解决的是更贴近业务，或者满足更细粒度的业务场景中的数据同步。

逻辑复制原理图

PostgreSQL

之前是有一篇逻辑复制输出其他格式的数据的文字，在下面这张图找到了他所处的层次和机理

PostgreSQL

在查看文档中，下面这张图，其中有一点不是很理解，在解码中产生

tuplebuf * oldtuple 和 tuplebuf * newtuple 之间的意义在哪里

PostgreSQL

而图中的另一个BDR,到底是什么，这里又挖掘了一下，BDR 是2quadrant 提供的一个异步多主逻辑复制的功能。

他定义如下四个概念

Mulit-master ,asynchronous , logical , replication

他们定义的复制是将数据从一个地方复制到另一个地方的过程。在BDR中，指的是BDR不是共享存储架构;每个节点都有自己的数据库副本，包括所有相关索引等。节点可以满足查询而不需要与其他节点通信，但是还必须有足够的存储空间来保存数据库中的所有数据

逻辑复制(基于行)是使用单个行值进行复制。它与发送数据块更改的物理(基于块的)复制形成对比。

在本地提交对一个BDR节点所做的更改之前，不会将其复制到其他节点。因此，在任何给定时间，所有节点上的数据并不完全相同;一些节点将拥有尚未到达其他节点的数据。PostgreSQL的基于块的复制解决方案也默认为异步复制。

从上面学习和了解的情况来说，从某个层面看逻辑复制有两个模块

DBR + 解码 + 解码发送 + 外部接收几个部分组成。

其中我们已经知道 DBR 是哪里来的，而decording 是怎么回事，下面来说说

整体的decording 的过程，从上一次最后读取后的LSN号对应的事务开始，从 cache 中读取日志，如果cache 里面没有日志会在磁盘中的日志段里面读取获取日志记录，存储到结构体 xlogrecord，然后在 logicaldecodingprocess record 模块中进行decode，然后进行循环将log 解析完毕。

在LogicalDecodingProcessRecord 是解析日志的关键，其中内存中维护一个哈希表，存放正在处理的事务信息，在处理每个日志记录是如果遇到一个begin 操作就会在哈希表中插入相应的事务，在遇到commit 会将整个事务所有的语句进行解析，每个事务都有一个快照，每次做事务都要更新快照，等到事务commit时获得最新的快照，f按岗位系统表，得到relation node id 与 relation name 之间关系信息，从而完成Decode，在完成Decode后，会调用 RecorderBuffercommit 函数，通过其中的 apply_change 函数将日志信息打印成可输出的内容，最终完成整个的Decode 过程。

部分资料原文，来自瀚高，与一位日本POSTGRESQL 大咖的网站

https://www.highgo.ca/2019/08/22/an-overview-of-logical-replication-in-postgresql/

PostgreSQL

以上是关于PostgreSQL 逻辑复制学习中的深入与疑问的主要内容，如果未能解决你的问题，请参考以下文章

PostgreSQL逻辑订阅中的复制状态查看

[译]PostgreSQL-15逻辑复制发布/订阅的两阶段提交

Windows 环境搭建 PostgreSQL 逻辑复制高可用架构数据库服务

剖析postgresql逻辑复制原理