Git 压缩作者的连续提交以压缩历史
Git Squash sequential commits by an author to compress history
我的团队正在开发一个很长的 运行 功能分支,现在有数百个提交,现在我需要将它合并到 master 中以进行生产发布。
我不想在该分支中有那么多提交,因为许多提交都是为了修复错误而完成的,并且每次提交只更改几行。
在 Github 的 PR 创建页面上,它限制了显示为 250 的提交。
From Github - "This comparison is big! We’re only showing the most recent 250 commits"
因此,我决定以一种方式压缩历史记录,将作者的一组顺序提交压缩为单个提交。
例如,假设我们有这样的提交:来自作者 A、B、C 和 D 的 A - A - A - B - B - A - C - D - D - B- B -A
那么生成的提交日志将有 A(3) - B
(2) - A - C - D(2) - B
(2) - A 其中 X`(N) 是来自作者 X 的 N 次提交的压缩提交。
编辑:我知道这需要一个脚本,我正在寻找相同的脚本。我不想通过交互式变基来做同样的事情。
没有内置的东西可以做到这一点;您将不得不编写自己的脚本。
为此,请从 git rev-list
或 git log
开始(两者本质上做同样的事情,但命令行选项略有不同)以遍历所有要扫描的提交。您的目标是将提交复制但压缩到一个新的临时分支上。例如,假设所有提交都是在分支 feature
上进行的,并且要合并到分支 target
中,您可以获得要检查的提交列表:
git rev-list --reverse --topo-order target..feature > /tmp/list
此处的输出是提交 SHA-1 ID 的列表。对于每个提交,您都希望找到作者,可能还有提交消息:
while read sha1; do
author_name=$(git log -n 1 --format=%an $sha1)
...
done < /tmp/list
如果当前作者姓名与前一个作者姓名相同,则只想累积此提交,但如果不同,则需要发出提交ID。由于 $author_name
最初未设置,它将是空字符串,因此第一次提交不会匹配以前的作者,但你必须特别处理这个(连同最终提交 ID),因为你总是想累积第一个提交,并在最后一次提交后或作者更改后采取行动。因此 ...
部分有点复杂。我们还需要一些设置工作来创建并进入一个临时分支,其第一个提交指向分支 target
的顶端。我们将在这里使用匿名分支,而不是使用命名的临时分支。
最后,压缩提交的方法特别棘手:最简单的方法是使用管道命令,git commit-tree
,然后推进临时分支。
将所有这些放在一起,我们得到以下完全未经测试的代码:
# add new squash-style commit using commit
make_squash_commit() {
local sha1= tree new_sha1
tree=$(git rev-parse $sha1^{tree})
new_sha1=$(git commit-tree $tree -p HEAD)
git update-ref -m "squash $sha1" HEAD $new_sha1
}
set -e
git rev-list --reverse --topo-order target..feature > /tmp/list
git checkout --detach target
: > /tmp/accum_log
prev_sha1=""
while read sha1; do
author_name=$(git log -n 1 --format=%an $sha1)
if [ "$author_name" != "$prev_name" -a -n "$prev_sha1" ]; then
make_squash_commit $prev_sha1 < /tmp/accum_log
: > /tmp/accum_log
fi
prev_name="$author_name"
prev_sha1=$sha1
git log -n 1 --format="%B" $sha1 >> /tmp/accum_log
done < /tmp/list
if [ -z "$prev_sha1" ]; then
echo "Warning: no commits found to squash!"
sha1=$(git rev-parse target)
fi
# squash final commit, then give anonymous branch a name
make_squash_commit $prev_sha1 < /tmp/accum_log
git checkout -b temp_branch
rm /tmp/list /tmp/accum_log
这个脚本中有一个故意设计的缺陷:它使用当前日期和时间(即适当的,因为你正在把多个作者的提交弄得一团糟,不管他们是否同意,都会压缩它们)。您可以 "fix" 通过在 git commit-tree
步骤中设置所有适当的环境变量来做到这一点(请参阅其文档)。
控制台:
git log --format="p|%h|%an|%s" --no-merges -n 190 | tail -r > commits.txt
PHP:
$fp = fopen("./commits.txt", "r");
$commits = array();
$previous_author = '';
while (($line = fgets($fp)) !== FALSE) {
list($mode, $sha, $current_author, $subject) = explode('|', $line);
if ($previous_author == '' || $previous_author !== $current_author) {
$previous_author = $current_author;
}
else {
$mode = 'f';
}
$output[] = implode(' ', array($mode, $sha, $subject));
}
fclose($fp);
print implode(' ', $output);
控制台:
git rebase -i HEAD~190
在交互式编辑器中,删除所有内容并粘贴上面 php 脚本的输出。我可以达到预期的效果。
我的团队正在开发一个很长的 运行 功能分支,现在有数百个提交,现在我需要将它合并到 master 中以进行生产发布。
我不想在该分支中有那么多提交,因为许多提交都是为了修复错误而完成的,并且每次提交只更改几行。
在 Github 的 PR 创建页面上,它限制了显示为 250 的提交。
From Github - "This comparison is big! We’re only showing the most recent 250 commits"
因此,我决定以一种方式压缩历史记录,将作者的一组顺序提交压缩为单个提交。
例如,假设我们有这样的提交:来自作者 A、B、C 和 D 的 A - A - A - B - B - A - C - D - D - B- B -A
那么生成的提交日志将有 A(3) - B
(2) - A - C - D(2) - B
(2) - A 其中 X`(N) 是来自作者 X 的 N 次提交的压缩提交。
编辑:我知道这需要一个脚本,我正在寻找相同的脚本。我不想通过交互式变基来做同样的事情。
没有内置的东西可以做到这一点;您将不得不编写自己的脚本。
为此,请从 git rev-list
或 git log
开始(两者本质上做同样的事情,但命令行选项略有不同)以遍历所有要扫描的提交。您的目标是将提交复制但压缩到一个新的临时分支上。例如,假设所有提交都是在分支 feature
上进行的,并且要合并到分支 target
中,您可以获得要检查的提交列表:
git rev-list --reverse --topo-order target..feature > /tmp/list
此处的输出是提交 SHA-1 ID 的列表。对于每个提交,您都希望找到作者,可能还有提交消息:
while read sha1; do
author_name=$(git log -n 1 --format=%an $sha1)
...
done < /tmp/list
如果当前作者姓名与前一个作者姓名相同,则只想累积此提交,但如果不同,则需要发出提交ID。由于 $author_name
最初未设置,它将是空字符串,因此第一次提交不会匹配以前的作者,但你必须特别处理这个(连同最终提交 ID),因为你总是想累积第一个提交,并在最后一次提交后或作者更改后采取行动。因此 ...
部分有点复杂。我们还需要一些设置工作来创建并进入一个临时分支,其第一个提交指向分支 target
的顶端。我们将在这里使用匿名分支,而不是使用命名的临时分支。
最后,压缩提交的方法特别棘手:最简单的方法是使用管道命令,git commit-tree
,然后推进临时分支。
将所有这些放在一起,我们得到以下完全未经测试的代码:
# add new squash-style commit using commit
make_squash_commit() {
local sha1= tree new_sha1
tree=$(git rev-parse $sha1^{tree})
new_sha1=$(git commit-tree $tree -p HEAD)
git update-ref -m "squash $sha1" HEAD $new_sha1
}
set -e
git rev-list --reverse --topo-order target..feature > /tmp/list
git checkout --detach target
: > /tmp/accum_log
prev_sha1=""
while read sha1; do
author_name=$(git log -n 1 --format=%an $sha1)
if [ "$author_name" != "$prev_name" -a -n "$prev_sha1" ]; then
make_squash_commit $prev_sha1 < /tmp/accum_log
: > /tmp/accum_log
fi
prev_name="$author_name"
prev_sha1=$sha1
git log -n 1 --format="%B" $sha1 >> /tmp/accum_log
done < /tmp/list
if [ -z "$prev_sha1" ]; then
echo "Warning: no commits found to squash!"
sha1=$(git rev-parse target)
fi
# squash final commit, then give anonymous branch a name
make_squash_commit $prev_sha1 < /tmp/accum_log
git checkout -b temp_branch
rm /tmp/list /tmp/accum_log
这个脚本中有一个故意设计的缺陷:它使用当前日期和时间(即适当的,因为你正在把多个作者的提交弄得一团糟,不管他们是否同意,都会压缩它们)。您可以 "fix" 通过在 git commit-tree
步骤中设置所有适当的环境变量来做到这一点(请参阅其文档)。
控制台:
git log --format="p|%h|%an|%s" --no-merges -n 190 | tail -r > commits.txt
PHP:
$fp = fopen("./commits.txt", "r");
$commits = array();
$previous_author = '';
while (($line = fgets($fp)) !== FALSE) {
list($mode, $sha, $current_author, $subject) = explode('|', $line);
if ($previous_author == '' || $previous_author !== $current_author) {
$previous_author = $current_author;
}
else {
$mode = 'f';
}
$output[] = implode(' ', array($mode, $sha, $subject));
}
fclose($fp);
print implode(' ', $output);
控制台:
git rebase -i HEAD~190
在交互式编辑器中,删除所有内容并粘贴上面 php 脚本的输出。我可以达到预期的效果。