Git合并内部

Posted

技术标签:

【中文标题】Git合并内部【英文标题】:Git merge internals 【发布时间】:2015-08-05 06:05:09 【问题描述】:

这可能最终会成为一个很长的问题,所以请多多包涵。

我在这里遇到了一个关于 git 合并决策的令人难以置信的解释:How does git merge work。我试图建立在这个解释的基础上,看看以这种方式描述 git merge 是否有任何漏洞。本质上,合并文件中是否出现一行的决定可以用真值表来描述:

W:原始文件, A:爱丽丝的分支, B: Bob 的分支

基于这个真值表,很容易想出一个基于行的算法来构造 D:通过查看 A 和 B 中相应的行并根据真值表做出决定,逐行构造 D。

我的第一个问题是 case (0, 0, 1),根据我上面发布的链接,这似乎表明虽然这种情况实际上是一个冲突,但 git 通常通过删除该行来处理它。这个案子真的会导致冲突吗?

我的第二个问题是关于删除案例 - (0, 1, 1) 和 (1, 0, 1)。直觉上,我觉得这些案件的处理方式可能会导致问题。假设 W 中有一个函数 foo()。这个函数实际上从未在任何代码段中调用过。假设在分支 A,Alice 最终决定删除 foo()。然而,在分支 B,Bob 最终决定使用 foo(),并编写了另一个名为 foo() 的函数 bar()。直观地说,根据真值表,似乎合并后的文件最终会删除 foo() 函数并添加 bar(),而 Bob 会想知道为什么 foo() 不再起作用了!这可能让我认为我为 3 路合并导出的真值表模型可能不完整并且遗漏了什么?

【问题讨论】:

D 是合并提交,对吧? 【参考方案1】:

我的第一个问题是 (0, 0, 1)

某些版本控制系统(例如 darcs)认为,在两个分支中进行相同的更改(在您的情况下是删除)并将它们合并会导致冲突。典型的例子是当你有两次时

-#define NUMBER_OF_WHATEVER 42
+#define NUMBER_OF_WHATEVER 43

合并算法无法知道您是希望合并产生 43(因为这是两个版本都同意的值)还是 44(因为 42 应该增加两次)。

但是,将此案例视为冲突会导致许多虚假冲突。例如,如果一个cherry-pick从master分支合并到一个维护分支,然后将维护分支合并到master,那么cherry-pick修改的每一行都会导致冲突。而且冲突标记会很奇怪,因为它们会在冲突标记的两侧显示相同的内容,比如

<<<<<<< HEAD
Hello world
=======
Hello world
>>>>>>> 77976da35a11db4580b80ae27e8d65caf5208086

因此,包括 Git 在内的大多数版本控制系统都选择在合并双方引入相同更改时不考虑冲突。

我的第二个问题是关于删除案例——(0, 1, 1) 和 (1, 0, 1)。

您所描述的是语义冲突。它们在理论上确实存在,您甚至可以找到合并可编译但与正在合并的分支相比具有不同语义的极端情况。没有魔法,没有文本合并算法可以检测或解决语义冲突。你必须和他们一起生活,或者独自工作。

在实践中,它们非常罕见。每天可能有数百万人使用版本控制系统并与之共存。大多数人可能从未想过问题会存在。

不过,一个好的组织可以大大降低语义冲突的风险。如果你检查你的代码在合并后仍然可以编译,你可以避免大约 90% 的语义冲突,如果你有一个自动测试套件,那么你必须找到一个语义冲突,它会创建一个你的测试套件没有涵盖的错误。有问题。

实际上,语义冲突并非特定于版本控制系统。另一个不使用合并的场景是

我读了代码,看到了一个函数f() 我的同事删除了函数f() 正在做最新的版本,已经没有f()了,我还记得有一个函数f(),我尝试使用它。

总之,不要害怕语义冲突。

【讨论】:

嗨,Matthieu——感谢您的宝贵时间和出色的回应。因此,总结您对第一个问题的回答—— (0, 0, 1) 在合并两个分支时永远不会导致冲突,而 (1, 1, 0) 可能会也可能不会导致冲突,具体取决于是否准确同一行被添加到分支的两侧(这几乎不会发生)。简而言之,任何语法冲突(与您描述的语义冲突相反)都归结为 (1, 1, 0) 情况。我说的对吗? 关于你对第二个问题的回答,与其删除 case (1, 0, 1) 和 (0, 1, 1) 的缺失行,不如版本控制系统选择把它们留在里面。所以本质上,(1, 0, 1) 和 (0, 1, 1) 的真值表的输出将是 1 而不是 0。这不会避免我勾勒出的特殊情况在一个分支中被删除但在另一个分支中没有被删除的调用函数? 因为有你的提案,不能删除一段代码。删除它,合并,它又回来了。没有人想要那样。【参考方案2】:

这里有一个sample repository 供您自己测试不同的合并行为。它有很多分支,可以相互合并。

随意分叉或克隆它:

git clone https://github.com/NickVolynkin/GitMergeResearch.git

我会尽快发布我的结果。

【讨论】:

嗨,尼克——感谢您抽出宝贵时间制作存储库。在制作上面的真值表之前,我也确实在本地存储库上工作过。你有没有发现任何与上表相矛盾的地方?

以上是关于Git合并内部的主要内容,如果未能解决你的问题,请参考以下文章

git分支合并为啥会发生冲突

Git详解——merge

Master分支在合并后丢失文件,文件在git merge输出中报告

解决 Git 冲突的 14 个建议和工具

5分钟学习git内部原理

合并对象与 Object.assign 覆盖内部对象而不合并 [重复]