集群正在进行无法在 servicefabric 上中断的升级

The cluster is going through a an upgrade which cannot be interrupted on servicefabric

我遇到了一些似乎不会随着服务结构消失的错误:

C:\Users\pks>armclient put /subscriptions/8393a037-5d39-462d-a583-09915b4493df/resourcegroups/TestServiceFabric11/providers/Microsoft.ServiceFabric/clusters/pksservicefabric11?api-version=2016-03-01 @updatenodesga.json
{
  "error": {
    "code": "PendingClusterUpgradeCannotBeInterrupted",
    "message": "The cluster is going through a an upgrade which cannot be interrupted."
  }
}

根据资源属性,状态已进入某种自动缩放模式,我不知道这意味着什么:

"provisioningState": "Failed",
"clusterId": "bfb52d19-238b-4046-8e35-ad95697c79b6",
"clusterCodeVersion": "5.0.135.9590",
"clusterState": "AutoScale",

如果 servicefabric 团队对 AutoScale 的含义有任何评论,那会很好吗?我已经能够在 promisioningstate 失败之前更新资源,但是自动缩放是我以前从未见过的。

看来你有两个问题

1)集群状态什么时候设置为"AutoScale"?当可靠性级别发生变化时,集群状态设置为 "AutoScale"。有关可靠性级别的详细信息,请参阅 https://azure.microsoft.com/en-in/documentation/articles/service-fabric-cluster-capacity/

2) 为什么您会收到错误消息 - "The cluster is going through a an upgrade which cannot be interrupted."?

您似乎删除了集群,否则更容易查明这里究竟发生了什么,但我认为这可能是发生了什么。如果我的猜测不正确,请提供重现步骤。

作为扩展的一部分,在添加 VM 实例后 - 您更改了可靠性级别(从银牌到金牌)。这促使 SF 集群继续更改系统服务的目标副本集大小,并将集群状态标记为 "AutoScale"。这种特殊的配置升级也被系统标记为 "uninterruptible",因为它会影响系统服务。在此升级完成之前,您尝试通过更改可靠性级别(从金牌到银牌)来缩减集群,这提示系统阻止它并引发错误消息。