ADX VM 的 SKU 比较

SKU comparison for ADX VM

link 显示了可用于 ADX 集群的各种 VM SKU 之间的比较。我的问题是关于以下两个 SKU:-

  1. D14 v2(类别:计算优化),SSD:614 GB,Cores:16,RAM:112GB
  2. DS14 v2 + 4 TB PS(类别:存储优化),SSD:4TB,Cores:16 RAM:112GB

纯粹看数字(SSD、RAM、内核),#2 似乎拥有#1 的一切,但除此之外,#2 还拥有 4TB 的 SSD——而#1 只有 614GB 的 SSD。因此,基于此,我将始终选择#2 而不是#1。那么这里的category是什么意思呢? #1 属于类别 "compute-optimized",而 #2 属于 "storage-optimized"。我的问题是,如果一个类别是根据此处提到的配置决定的,那么我们应该能够将 #2 称为存储和计算优化,因为 #2 具有与 #1 相同的计算,然后它有一些额外的东西#1。那么为什么#2 仅列为存储优化。我试图了解在计算密集型作业中使用 #1 比 #2 是否有额外的优势——因为如果我只看这里的数字,我看不出有任何理由(除了 cost ,两者也没有太大区别虽然)为什么我不应该使用#2 而不是#1。可能 #1 有一些独特的东西在 #2 中缺失,在那个 link 中没有指定。

根据您的问题,您似乎在很大程度上忽略了对成本的考虑 - 以下 table(在您链接到的同一文档中)总结了选择 SKU 的主要考虑因素 -你可以看到其中之一是 Cost per GB cache per core.

另一个示例 - 假设您可以使用您提到的任一 SKU 达到相同的总缓存 (SSD) 大小 - 对于一个,您的集群将具有 X 个节点,对于其他 Y 个节点。如果 Y > X,则另一个集群中的数据将分布在更多节点上,从而在 ingestion 和查询期间允许更多的并行性。当然,两种选择的成本可能不同。

最后 - 我强烈建议您咨询 cost estimator 并了解不同的 SKU 选择如何影响集群的总估计成本,因为成本对您的情况并非毫无意义(假设您知道您正在处理的数据量)。