Databricks API 2.0 - 集群获得响应 - TEMPORARILY_UNAVAILABLE

Databricks API 2.0 - Cluster get response - TEMPORARILY_UNAVAILABLE

我在 Azure Databricks 上有一个 spark 集群,我正在使用 C# API 启动集群并获取集群状态。直到 10 月 24 日,这几个月一直运行良好。从那时起,我开始收到以下格式的错误消息

集群获取响应:{"error_code":"TEMPORARILY_UNAVAILABLE","message":"No webapps are available to handle your request. Please try again later."}

我的集群在美东地区。

在尝试访问集群状态或启动集群时,此错误不断出现。我附上了最近几天收到的错误示例。

谁能告诉我如何解决这个问题?

此问题是由于 Azure 中断造成的。

影响摘要:在 2019 年 10 月 25 日大约 11:00 和 14:40 UTC 之间,使用 Azure Databricks 的一部分客户可能已经收到 'No Web App available' 登录到 Databricks 工作区时的错误通知。相关 API 调用可能也没有返回响应。此外,使用数据工厂 v2 的一小部分客户可能收到了数据流作业的失败通知。

初步根本原因: 工程师确定用于处理工作区访问请求的后端数据库变得不健康,导致请求失败。由于此数据库支持美国东部、美国东部 2、美国中部和美国中北部地区的控制平面,因此只有这些地区的客户会受到影响。此外,这些地区的少数数据工厂 v2 客户会看到此问题对下游的影响。

缓解措施: 工程师重新部署了受影响的后端数据库以缓解该问题。

后续步骤:工程师将继续调查以确定完整的根本原因并防止未来再次发生。通过创建自定义服务运行状况警报,随时了解 Azure 服务问题:https://aka.ms/ash-videos for video tutorials and https://aka.ms/ash-alerts 获取操作文档。

详情请参考“Azure Service Status History”。

更新:10 月 31 日中断

影响摘要:在 2019 年 10 月 31 日 00:00 UTC 和 00:45 之间,工程师进入维护期以缓解最新 3.5 中的回归可能会影响您的 ODBC/JDBC 服务的升级。工程师在维护期间执行了大约 10 分钟的修补程序。在应用修补程序时,Databricks 集群的创建可能会受到短暂的影响,以及相关的 API 调用(创建、更新、删除、自动缩放)。对用户界面的访问也可能受到短暂影响。 运行 个作业或以前创建的集群应该不会受到影响。

希望对您有所帮助。