Git 压缩作者的连续提交以压缩历史

Git Squash sequential commits by an author to compress history

我的团队正在开发一个很长的 运行 功能分支,现在有数百个提交,现在我需要将它合并到 master 中以进行生产发布。

我不想在该分支中有那么多提交,因为许多提交都是为了修复错误而完成的,并且每次提交只更改几行。

在 Github 的 PR 创建页面上,它限制了显示为 250 的提交。

From Github - "This comparison is big! We’re only showing the most recent 250 commits"

因此,我决定以一种方式压缩历史记录,将作者的一组顺序提交压缩为单个提交。

例如,假设我们有这样的提交:来自作者 A、B、C 和 D 的 A - A - A - B - B - A - C - D - D - B- B -A 那么生成的提交日志将有 A(3) - B(2) - A - C - D(2) - B(2) - A 其中 X`(N) 是来自作者 X 的 N 次提交的压缩提交。

编辑:我知道这需要一个脚本,我正在寻找相同的脚本。我不想通过交互式变基来做同样的事情。

没有内置的东西可以做到这一点;您将不得不编写自己的脚本。

为此,请从 git rev-listgit log 开始(两者本质上做同样的事情,但命令行选项略有不同)以遍历所有要扫描的提交。您的目标是将提交复制但压缩到一个新的临时分支上。例如,假设所有提交都是在分支 feature 上进行的,并且要合并到分支 target 中,您可以获得要检查的提交列表:

git rev-list --reverse --topo-order target..feature > /tmp/list

此处的输出是提交 SHA-1 ID 的列表。对于每个提交,您都希望找到作者,可能还有提交消息:

while read sha1; do
    author_name=$(git log -n 1 --format=%an $sha1)
    ...
done < /tmp/list

如果当前作者姓名与前一个作者姓名相同,则只想累积此提交,但如果不同,则需要发出提交ID。由于 $author_name 最初未设置,它将是空字符串,因此第一次提交不会匹配以前的作者,但你必须特别处理这个(连同最终提交 ID),因为你总是想累积第一个提交,并在最后一次提交后或作者更改后采取行动。因此 ... 部分有点复杂。我们还需要一些设置工作来创建并进入一个临时分支,其第一个提交指向分支 target 的顶端。我们将在这里使用匿名分支,而不是使用命名的临时分支。

最后,压缩提交的方法特别棘手:最简单的方法是使用管道命令,git commit-tree,然后推进临时分支。

将所有这些放在一起,我们得到以下完全未经测试的代码:

# add new squash-style commit using commit 
make_squash_commit() {
    local sha1= tree new_sha1

    tree=$(git rev-parse $sha1^{tree})
    new_sha1=$(git commit-tree $tree -p HEAD)
    git update-ref -m "squash $sha1" HEAD $new_sha1
}

set -e
git rev-list --reverse --topo-order target..feature > /tmp/list
git checkout --detach target
: > /tmp/accum_log
prev_sha1=""
while read sha1; do
    author_name=$(git log -n 1 --format=%an $sha1)
    if [ "$author_name" != "$prev_name" -a -n "$prev_sha1" ]; then
        make_squash_commit $prev_sha1 < /tmp/accum_log
        : > /tmp/accum_log
    fi
    prev_name="$author_name"
    prev_sha1=$sha1
    git log -n 1 --format="%B" $sha1 >> /tmp/accum_log
done < /tmp/list
if [ -z "$prev_sha1" ]; then
    echo "Warning: no commits found to squash!"
    sha1=$(git rev-parse target)
fi
# squash final commit, then give anonymous branch a name
make_squash_commit $prev_sha1 < /tmp/accum_log
git checkout -b temp_branch
rm /tmp/list /tmp/accum_log

这个脚本中有一个故意设计的缺陷:它使用当前日期和时间(即适当的,因为你正在把多个作者的提交弄得一团糟,不管他们是否同意,都会压缩它们)。您可以 "fix" 通过在 git commit-tree 步骤中设置所有适当的环境变量来做到这一点(请参阅其文档)。

控制台:

git log --format="p|%h|%an|%s" --no-merges -n 190 | tail -r  > commits.txt

PHP:

$fp = fopen("./commits.txt", "r");

$commits = array();
$previous_author = '';
while (($line = fgets($fp)) !== FALSE) {
  list($mode, $sha, $current_author, $subject) = explode('|', $line);
  if ($previous_author == '' || $previous_author !== $current_author) {
    $previous_author = $current_author;
  }
  else {
    $mode = 'f';
  }
  $output[] = implode(' ', array($mode, $sha, $subject));
}

fclose($fp);

print implode(' ', $output);

控制台:

git rebase -i HEAD~190

在交互式编辑器中,删除所有内容并粘贴上面 php 脚本的输出。我可以达到预期的效果。