服务的操作可恢复性(?)

Operation Resumability of Service (?)

#Cloud-Native方式,保证了服务的可用性。为请求提供服务的 #containers 可能会死亡并自我修复,但服务端点需要确保请求得到服务。

如果该服务基于 TCP 套接字服务自定义协议并且涉及复杂且冗长的 运行 操作,则需要支持 #Resumability 操作(从死容器离开的地方)在服务中?如果YES,有什么方法和途径可以实现?

不幸的是,没有标准的方法来实现长 运行 可恢复操作。最接近的是使用像 Temporal 这样的编排平台。它允许通过其业务 ID 重新连接到已经 运行 的操作(也称为工作流)。 Temporal 也开箱即用地处理容器故障,无缝重建操作实施状态。

请参阅描述时间编程模型的 my presentation