代理节点上DCOS导航星服务启动失败

DCOS navstar service failed to start on agent nodes

我正在开发服务器上设置 DC/OS 并面临代理节点之一无法 运行 navstar 服务:

# journalctl -u dcos-navstar -b
Mar 18 13:45:15 localhost.localdomain systemd[1]: Starting Navstar: A distributed systems & network overlay orchestration engine...
Mar 18 13:45:15 localhost.localdomain check-time[5868]: Checking whether time is synchronized using the kernel adjtimex API.
Mar 18 13:45:15 localhost.localdomain check-time[5868]: Time can be synchronized via most popular mechanisms (ntpd, chrony, systemd-timesyncd, etc.)
Mar 18 13:45:15 localhost.localdomain check-time[5868]: Time is in sync!
Mar 18 13:45:15 localhost.localdomain ping[5870]: ping: ready.spartan: Name or service not known
Mar 18 13:45:15 localhost.localdomain systemd[1]: dcos-navstar.service: control process exited, code=exited status=2
Mar 18 13:45:15 localhost.localdomain systemd[1]: Failed to start Navstar: A distributed systems & network overlay orchestration engine.

ntpd 服务已安装并且 运行ning(服务处于活动状态)。与 ntpd 的时间同步工作正常。请指教

检查 123 端口是否打开并且没有被 iptables 或其他防火墙阻止。或者尝试使用 chrony 作为服务将系统时钟与 NTP 服务器同步(它比 ntp 更准确,功能更多)。 对于 CentOS:

yum install chrony

我在 DC/OS 上遇到了同样的问题。但不仅 navstar.service,而且 metronome.service 也失败了(同一时间同步问题)。花了很多时间寻找问题的根源。终于迁移到chrony,问题消失了。

对于长运行 的任务,请使用 Marathon。对于一次性任务或 cron 任务,请使用 Chronos。您只需使用 REST API 通过上述框架在 DCOS 放置和管理您的任务。我建议你使用容器。您可以在这里阅读:micro-services at DCOS