如何从不相关的存储库中合并历史
How to merge history from unrelated repositories
我在 SVN 上有一个这样组织的旧项目:
- /some/sub-directories/a/trunk/foo
- /some/sub-directories/b/trunk/foo
- /some/sub-directories/c/trunk/foo
我使用 GitHub 工具 git-import-svn-raw
将这三个存储库迁移到三个 Git 存储库下:
- a.git
- b.git
- c.git
我用这个命令去掉了路径
git filter-branch --prune-empty --subdirectory-filter \
/some/sub-directories/a/trunk/foo master
现在我想将所有这三个项目的历史导入到我有三个目录 a
、b
、c
的同一个存储库中。
bundle.git/
a/
b/
c/
这个想法不是合并子树,而是将每个单独的子目录的历史记录交织在一起。
这可能吗?
注意:将整个 SVN 存储库转换为单个存储库会更容易,但它不起作用。我在使用 git-import-svn-raw
工具时遇到很多问题。同样的问题出现在 git svn clone --stdlayout
中,需要一个存储库,但事实并非如此。我也试过 svn2git
但它也不起作用。
我建议不要使用 "bundle" 作为 repo 的名称,因为 bundle
与 git 不同。为避免混淆问题,我将在整个回答中使用您的术语,但我会使用不同的名称。
因此很容易将所有提交放入同一个 repo。
cd bundle.git
git remote add a ../a.git
git remote add b ../b.git
git remote add c ../c.git
git fetch --all
现在您有像 remote/a/master
、remote/b/master
、remote/c/master
.
这样的引用
A1 -- A2 -- A3 -- A4 <--(a/master)
B1 -- B2 -- B3 -- B4 <--(b/master)
C1 -- C2 -- C3 -- C4 <--(c/master)
(master)
请注意,我假设您从 master
开始,没有任何提交("unborn" 分支)并且它仍然处于该状态。
接下来,获得包含合并内容的单个提交也不难。例如你可以这样做:
git reset --hard a/master
get merge --allow-unrelated-histories b/master
git merge --allow-unrelated-histories c/master
哪个会给你
(a/master)
v
A1 -- A2 -- A3 -- A4 -- M1 ------------- M2 <--(master)
/ /
B1 --- B2 --- B3 --- B4 <--(b/master) /
/
C1 -------- C2 -------- C3 -------- C4 <--(c/master)
此历史记录完整且正确,但历史提交没有交错且没有组合内容(TREE
个对象)。因此,如果您查看 B3
,您将看不到 a
或 c
在相应时间的样子,例如。
这可能就足够了。 log
的输出将默认为按时间倒序排列,您可以提供排序选项来准确影响此历史记录的排序方式(请参阅 git log
文档)。但这不是你要求的...
所以下一步你可以
git rebase -i --root master
这将显示一个显示所有提交的 "TODO" 列表;但是您必须手动确定您希望它们交错的顺序。 (默认顺序遵循每个分支,一次一个。)所以这可能非常乏味。您可以使用 git log
输出找出正确的顺序,然后相应地重新安排 TODO 列表。
UPDATE :我突然想到我应该添加一些关于 rebase
步骤的警告。
首先,上面只明确说明了master
个分支。当然,每个回购协议都可以有额外的分支,您必须决定如何反映这些分支。也许您会决定分支点(可从分支到达的 master
的第一个提交)应该保持不变,并且该分支根本不会将来自其他回购协议的更改交织到其中(假设这不会导致分支名称冲突)。或者您可能会决定以某种方式组合每个源代码库中的相应分支。
其次,如果原始历史记录中存在合并,那么您必须决定如何在变基中处理它们。如果合并包含冲突解决方案,或者是 "evil merges"(即引入相对于默认合并结果的更改的合并),这尤其是一个问题。上述过程将尝试生成单一的线性历史记录。如果这不是您想要的,那么就很难完成这项工作,因为如果您告诉 rebase
保留合并,那么它也会将三个历史记录分开。 (此外,--preserve-merges
与 --interactive
/ -i
不能很好地混合。)
所以上面的方法适用于相对简单的历史,而对于更复杂的历史,它可能只是不切实际。
另请参阅 ,了解根据提交时间戳 "zipper up" 两个存储库的另一种方法。
我在 SVN 上有一个这样组织的旧项目:
- /some/sub-directories/a/trunk/foo
- /some/sub-directories/b/trunk/foo
- /some/sub-directories/c/trunk/foo
我使用 GitHub 工具 git-import-svn-raw
将这三个存储库迁移到三个 Git 存储库下:
- a.git
- b.git
- c.git
我用这个命令去掉了路径
git filter-branch --prune-empty --subdirectory-filter \
/some/sub-directories/a/trunk/foo master
现在我想将所有这三个项目的历史导入到我有三个目录 a
、b
、c
的同一个存储库中。
bundle.git/
a/
b/
c/
这个想法不是合并子树,而是将每个单独的子目录的历史记录交织在一起。
这可能吗?
注意:将整个 SVN 存储库转换为单个存储库会更容易,但它不起作用。我在使用 git-import-svn-raw
工具时遇到很多问题。同样的问题出现在 git svn clone --stdlayout
中,需要一个存储库,但事实并非如此。我也试过 svn2git
但它也不起作用。
我建议不要使用 "bundle" 作为 repo 的名称,因为 bundle
与 git 不同。为避免混淆问题,我将在整个回答中使用您的术语,但我会使用不同的名称。
因此很容易将所有提交放入同一个 repo。
cd bundle.git
git remote add a ../a.git
git remote add b ../b.git
git remote add c ../c.git
git fetch --all
现在您有像 remote/a/master
、remote/b/master
、remote/c/master
.
A1 -- A2 -- A3 -- A4 <--(a/master)
B1 -- B2 -- B3 -- B4 <--(b/master)
C1 -- C2 -- C3 -- C4 <--(c/master)
(master)
请注意,我假设您从 master
开始,没有任何提交("unborn" 分支)并且它仍然处于该状态。
接下来,获得包含合并内容的单个提交也不难。例如你可以这样做:
git reset --hard a/master
get merge --allow-unrelated-histories b/master
git merge --allow-unrelated-histories c/master
哪个会给你
(a/master)
v
A1 -- A2 -- A3 -- A4 -- M1 ------------- M2 <--(master)
/ /
B1 --- B2 --- B3 --- B4 <--(b/master) /
/
C1 -------- C2 -------- C3 -------- C4 <--(c/master)
此历史记录完整且正确,但历史提交没有交错且没有组合内容(TREE
个对象)。因此,如果您查看 B3
,您将看不到 a
或 c
在相应时间的样子,例如。
这可能就足够了。 log
的输出将默认为按时间倒序排列,您可以提供排序选项来准确影响此历史记录的排序方式(请参阅 git log
文档)。但这不是你要求的...
所以下一步你可以
git rebase -i --root master
这将显示一个显示所有提交的 "TODO" 列表;但是您必须手动确定您希望它们交错的顺序。 (默认顺序遵循每个分支,一次一个。)所以这可能非常乏味。您可以使用 git log
输出找出正确的顺序,然后相应地重新安排 TODO 列表。
UPDATE :我突然想到我应该添加一些关于 rebase
步骤的警告。
首先,上面只明确说明了master
个分支。当然,每个回购协议都可以有额外的分支,您必须决定如何反映这些分支。也许您会决定分支点(可从分支到达的 master
的第一个提交)应该保持不变,并且该分支根本不会将来自其他回购协议的更改交织到其中(假设这不会导致分支名称冲突)。或者您可能会决定以某种方式组合每个源代码库中的相应分支。
其次,如果原始历史记录中存在合并,那么您必须决定如何在变基中处理它们。如果合并包含冲突解决方案,或者是 "evil merges"(即引入相对于默认合并结果的更改的合并),这尤其是一个问题。上述过程将尝试生成单一的线性历史记录。如果这不是您想要的,那么就很难完成这项工作,因为如果您告诉 rebase
保留合并,那么它也会将三个历史记录分开。 (此外,--preserve-merges
与 --interactive
/ -i
不能很好地混合。)
所以上面的方法适用于相对简单的历史,而对于更复杂的历史,它可能只是不切实际。
另请参阅