如何从不相关的存储库中合并历史

How to merge history from unrelated repositories

我在 SVN 上有一个这样组织的旧项目:

我使用 GitHub 工具 git-import-svn-raw 将这三个存储库迁移到三个 Git 存储库下:

我用这个命令去掉了路径

git filter-branch --prune-empty --subdirectory-filter \
/some/sub-directories/a/trunk/foo master

现在我想将所有这三个项目的历史导入到我有三个目录 abc 的同一个存储库中。

bundle.git/
   a/
   b/
   c/

这个想法不是合并子树,而是将每个单独的子目录的历史记录交织在一起。

这可能吗?

注意:将整个 SVN 存储库转换为单个存储库会更容易,但它不起作用。我在使用 git-import-svn-raw 工具时遇到很多问题。同样的问题出现在 git svn clone --stdlayout 中,需要一个存储库,但事实并非如此。我也试过 svn2git 但它也不起作用。

我建议不要使用 "bundle" 作为 repo 的名称,因为 bundle 与 git 不同。为避免混淆问题,我将在整个回答中使用您的术语,但我会使用不同的名称。

因此很容易将所有提交放入同一个 repo。

cd bundle.git
git remote add a ../a.git
git remote add b ../b.git
git remote add c ../c.git
git fetch --all

现在您有像 remote/a/masterremote/b/masterremote/c/master.

这样的引用
A1 -- A2 -- A3 -- A4 <--(a/master)

B1 -- B2 -- B3 -- B4 <--(b/master)

C1 -- C2 -- C3 -- C4 <--(c/master)

(master)

请注意,我假设您从 master 开始,没有任何提交("unborn" 分支)并且它仍然处于该状态。

接下来,获得包含合并内容的单个提交也不难。例如你可以这样做:

git reset --hard a/master
get merge --allow-unrelated-histories b/master
git merge --allow-unrelated-histories c/master

哪个会给你

               (a/master)
                   v
A1 -- A2 -- A3 -- A4 -- M1 ------------- M2 <--(master)
                       /                /
B1 --- B2 --- B3 --- B4 <--(b/master)  /
                                      /
C1 -------- C2 -------- C3 -------- C4 <--(c/master)

此历史记录完整且正确,但历史提交没有交错且没有组合内容(TREE 个对象)。因此,如果您查看 B3,您将看不到 ac 在相应时间的样子,例如。

这可能就足够了。 log 的输出将默认为按时间倒序排列,您可以提供排序选项来准确影响此历史记录的排序方式(请参阅 git log 文档)。但这不是你要求的...

所以下一步你可以

git rebase -i --root master

这将显示一个显示所有提交的 "TODO" 列表;但是您必须手动确定您希望它们交错的顺序。 (默认顺序遵循每个分支,一次一个。)所以这可能非常乏味。您可以使用 git log 输出找出正确的顺序,然后相应地重新安排 TODO 列表。

UPDATE :我突然想到我应该添加一些关于 rebase 步骤的警告。

首先,上面只明确说明了master个分支。当然,每个回购协议都可以有额外的分支,您必须决定如何反映这些分支。也许您会决定分支点(可从分支到达的 master 的第一个提交)应该保持不变,并且该分支根本不会将来自其他回购协议的更改交织到其中(假设这不会导致分支名称冲突)。或者您可能会决定以某种方式组合每个源代码库中的相应分支。

其次,如果原始历史记录中存在合并,那么您必须决定如何在变基中处理它们。如果合并包含冲突解决方案,或者是 "evil merges"(即引入相对于默认合并结果的更改的合并),这尤其是一个问题。上述过程将尝试生成单一的线性历史记录。如果这不是您想要的,那么就很难完成这项工作,因为如果您告诉 rebase 保留合并,那么它也会将三个历史记录分开。 (此外,--preserve-merges--interactive / -i 不能很好地混合。)

所以上面的方法适用于相对简单的历史,而对于更复杂的历史,它可能只是不切实际。

另请参阅 ,了解根据提交时间戳 "zipper up" 两个存储库的另一种方法。