AWS Mongo QuickStart 从未完成

AWS Mongo QuickStart never completes

问题

我正在尝试完成 MongoDB on AWS quickstart 以创建一个简单的 MongoDB 集群。不幸的是,它从未完成推出,在最后一个安装部分 (PrimaryReplicaNodeXYWaitForNodeInstallGP2) 未在一小时内完成后取消。

背景

我的设置如下:

AvailabilityZone0   eu-central-1a
AvailabilityZone1   eu-central-1b
AvailabilityZone2   eu-central-1b
BuildBucket quickstart-reference/mongodb/latest
ClusterReplicaSetCount  0
ClusterShardCount   1
ConfigServerInstanceType    t2.micro
Iops    100
KeyName my_definitely_working_keypair
MongoDBVersion  3.2
NATInstanceType t2.small
NodeInstanceType    m3.medium
PrimaryReplicaSubnet    10.0.2.0/24
PublicSubnet    10.0.1.0/24
RemoteAccessCIDR    XXX.XXX.0.0/16
SecondaryReplicaSubnet0 10.0.3.0/24
SecondaryReplicaSubnet1 10.0.4.0/24
ShardsPerNode   0
VolumeSize  40
VolumeType  gp2
VPCCIDR 10.0.0.0/16

导致 same behaviour, as named in the AWS forum 回滚:

In "Ressources", all but one subtask never gets completed and stays on forever as "PrimaryReplicaNode0WaitForNodeInstallGP2 - PrimaryReplicaNode0WaitForNodeInstallWaitHandle - Created in Progress - Ressource creation initiated"

所以,我正在进一步研究这个问题。 post 提到了 to another forum thread,有问题的用户应该尝试删除他们的 DynamoDB 条目并将 ClusterReplicaSetCount 设置为 3。

这里的问题:在 DynamoDB 中没有条目,将 ClusterReplicaSetCount 更改为 3 也会导致回滚并出现类似错误:

ConfigServer2WaitForNodeInstall WaitCondition timed out. Received 0 conditions when expecting 1

以后

MONGODBSTACK1 The following resource(s) failed to create: [ConfigServer1WaitForNodeInstall, PrimaryReplicaNode00WaitForNodeInstallGP2, ConfigServer0WaitForNodeInstall, SecondaryReplicaNode00WaitForNodeInstallGP2, SecondaryReplicaNode01WaitForNodeInstallGP2, ConfigServer2WaitForNodeInstall].

总结

在这两种情况下,PrimaryReplicaNodeXYWaitForNodeInstallGP2(其中 XY 是节点的编号)均失败,而安装的所有其他部分均已成功完成。我完全蒙在鼓里。

有人解决这个问题吗?快速入门是从 2016 年开始的,我想一定有人成功地创建了这个 mongo 堆栈!?

经过日复一日的艰苦奋斗,没有解决办法,在手册和模板上an update(一年多了,感觉好像我的祈祷被听到了):

https://docs.aws.amazon.com/quickstart/latest/mongodb/welcome.html

所以这也带来了一个完全修改的基础设施和一个更复杂的设置形式,变化被描述为:

Upgraded MongoDB to version 3.4; removed sharding configuration; updated security groups and added database security; updated parameters

后面的教程和以前的版本很相似,所以这里不费吹灰之力了。

一切顺利,我现在完成了堆栈,其中包括

mongoDB mongoDB 副本 堡垒堆栈 VPC 堆栈

这样这部分就基本完成了。如果出现其他问题,我会为此提出一个新问题。

我在拆除一个开发集群并尝试建立一个同名的新集群后注意到这一点。

被拆除的集群孤立了一个 dynamodb table,新堆栈试图将工作节点状态发布到该名称上。我手动删除了这个 dynamo table 并再次尝试第三次启动具有相同名称的堆栈并成功了。