Set table 与 multi set table 表现

Set table vs multi set table performance

我必须准备一个 table,我将在其中保存一些汇总数据的每周结果。 Table 将有 30 个字段(10 个字符,20 个小数),我想我每周会有 25 万行。

在我的脑海中,我可以看到两种情况:

  1. 设置 table 并依靠 teradata 来防止重复行 - 它应该在插入新数据时跳过重复条目
  2. 带有 UPI 的多集 table - 插入重复行时会出错。

INSERT 语句将在 excel 上通过 VBA 执行,其中处理可能的 teradata 错误不是问题。

在一年内大约有 1400 万行

,哪种情况会比 运行 更快

还有其他方法吗?

此致

在高层次上,由于您的 table 上的数据计数相对较高,建议不要使用 SET tables,而是使用 multiset [=14] =]. 有关更多信息,您可以参考此 link

http://www.dwhpro.com/teradata-multiset-tables/ 

您为什么关心重复行?当您存储每周聚合时,根本不应该有重复项。并且重复行与重复主键值不同。

只需选择最适合您的 join/access 模式的圆周率(可能按日期划分)。为避免任何潜在的重复,您可以简单地使用 MERGE 而不是 INSERT。