Service Fabric 群集部署失败

Service Fabric Cluster Deploy Fails

我在将集群部署到 Azure 时遇到问题。我正在使用通过 Visual Studio (2017) 提供的模板,如 here 所述,使用 server/cluster 证书保护它 如所述 here.

我正在通过 Visual Studio 部署,模板似乎部署成功,没有任何错误。但是,当在门户中查看集群时,它卡在 "Deploying" 状态,没有出现任何节点。 RDP:ing 进入各个节点并查看事件查看器 (Windows Logs/System) 发现 Azure Service Fabric 节点 Bootstrap 代理服务卡在循环中,starting/stopping似乎无限期。

查看 Windows Logs/Application 我可以看到以下 (4) errors/warnings 每次重启尝试都会重复:

启动服务失败,错误:System.ArgumentNullException:值不能为空。 参数名称:路径 在 System.IO.Path.GetFullPathInternal(字符串路径) 在 Microsoft.Azure.ServiceFabric.Extension.Core.SetupHelper.ConfigNode(字节 [] clusterManifest,字符串 nodeTypeRef,字符串 machineName,字符串 ipAddress,字符串 faultDomain,字符串 upgradeDomain,字符串 dataRoot) 在 Microsoft.Azure.ServiceFabric.Extension.Core.NodeBootstrapAgent.TryConfigNode(运行timeCluster clusterConfig, NodeDescription nodeDescription) 在 Microsoft.Azure.ServiceFabric.Extension.Core.NodeBootstrapAgent.StartFabricHostService(布尔值是 Bootstrapping)

错误:System.ArgumentNullException:值不能为空。 参数名称:路径 在 System.IO.Path.GetFullPathInternal(字符串路径) 在 Microsoft.Azure.ServiceFabric.Extension.Core.SetupHelper.ConfigNode(字节 [] clusterManifest,字符串 nodeTypeRef,字符串 machineName,字符串 ipAddress,字符串 faultDomain,字符串 upgradeDomain,字符串 dataRoot) 在 Microsoft.Azure.ServiceFabric.Extension.Core.NodeBootstrapAgent.TryConfigNode(运行timeCluster clusterConfig, NodeDescription nodeDescription) 在 Microsoft.Azure.ServiceFabric.Extension.Core.NodeBootstrapAgent.StartFabricHostService(布尔值是 Bootstrapping) 在 Microsoft.Azure.ServiceFabric.Extension.Core.NodeBootstrapAgent.d__d.MoveNext() --- 从抛出异常的先前位置开始的堆栈跟踪结束 --- 在 System.Runtime.CompilerServices.TaskAwaiter.ThrowForNonSuccess(任务任务) 在 System.Runtime.CompilerServices.TaskAwaiter.HandleNonSuccessAndDebuggerNotification(任务任务) 在 Microsoft.Azure.ServiceFabric.Extension.Core.NodeBootstrapAgent.d__0.MoveNext()

申请:ServiceFabricNodeBootstrapAgent.exe 框架版本:v4.0.30319 说明:进程因未处理的异常而终止。 异常信息:System.ArgumentNullException 在 System.IO.Path.GetFullPathInternal(System.String) 在 Microsoft.Azure.ServiceFabric.Extension.Core.SetupHelper.ConfigNode(字节[], System.String, System.String, System.String, System.String, System.String, System.String) 在 Microsoft.Azure.ServiceFabric.Extension.Core.NodeBootstrapAgent.TryConfigNode(Microsoft.Azure.ServiceFabric.Extension.Core.RuntimeCluster, Microsoft.Azure.ServiceFabric.Extension.Core.NodeDescription) 在 Microsoft.Azure.ServiceFabric.Extension.Core.NodeBootstrapAgent.StartFabricHostService(布尔值) 在 Microsoft.Azure.ServiceFabric.Extension.Core.NodeBootstrapAgent+d__d.MoveNext() 在 System.Runtime.CompilerServices.TaskAwaiter.ThrowForNonSuccess(System.Threading.Tasks.Task) 在 System.Runtime.CompilerServices.TaskAwaiter.HandleNonSuccessAndDebuggerNotification(System.Threading.Tasks.Task) 在 Microsoft.Azure.ServiceFabric.Extension.Core.NodeBootstrapAgent+d__0.MoveNext() 在 System.Runtime.CompilerServices.TaskAwaiter.ThrowForNonSuccess(System.Threading.Tasks.Task) 在 System.Runtime.CompilerServices.TaskAwaiter.HandleNonSuccessAndDebuggerNotification(System.Threading.Tasks.Task) 在 Microsoft.Azure.ServiceFabric.Extension.Service.Service+d__0.MoveNext() 在 System.Runtime.CompilerServices.AsyncMethodBuilderCore+<>c.b__6_1(System.Object) 在 System.Threading.ExecutionContext.RunInternal(System.Threading.ExecutionContext, System.Threading.ContextCallback, System.Object, 布尔值) 在 System.Threading.ExecutionContext.运行(System.Threading.ExecutionContext, System.Threading.ContextCallback, System.Object, 布尔值) 在 System.Threading.QueueUserWorkItemCallback.System.Threading.IThreadPoolWorkItem.ExecuteWorkItem() 在 System.Threading.ThreadPoolWorkQueue.Dispatch()

错误应用程序名称:ServiceFabricNodeBootstrapAgent.exe,版本:1.0.0.143,时间戳:0x58c87254 故障模块名称:KERNELBASE.dll,版本:6.3.9600.18340,时间戳:0x57366075 异常代码:0xe0434352 故障偏移量:0x0000000000008a5c 故障进程 ID:0x9b0 错误的应用程序启动时间:0x01d29d73912bda98 错误的应用程序路径:C:\Packages\Plugins\Microsoft.Azure.ServiceFabric.ServiceFabricNode.0.0.34\Service\ServiceFabricNodeBootstrapAgent.exe 错误模块路径:C:\Windows\system32\KERNELBASE.dll 报告编号:cf297669-0966-11e7-80c5-000d3a27d68c 错误包全名: 错误包相关应用程序 ID:

重新启动节点没有帮​​助,我已验证证书已安装在 VM 上。我在门户中没有记录任何错误,只有集群上的 "Deploying" 消息。节点是 Windows 服务器 R2。 有任何想法吗?显然,给 System.IO.Path.GetFullPathInternal 的路径是空的,但可能是什么原因造成的?

也许这是正确的答案:http://amolenk.com/2017/03/15/ServiceFabricNodeBootstrapAgent-breaking-change/