Set table 与 multi set table 表现
Set table vs multi set table performance
我必须准备一个 table,我将在其中保存一些汇总数据的每周结果。 Table 将有 30 个字段(10 个字符,20 个小数),我想我每周会有 25 万行。
在我的脑海中,我可以看到两种情况:
- 设置 table 并依靠 teradata 来防止重复行 - 它应该在插入新数据时跳过重复条目
- 带有 UPI 的多集 table - 插入重复行时会出错。
INSERT 语句将在 excel 上通过 VBA 执行,其中处理可能的 teradata 错误不是问题。
在一年内大约有 1400 万行
,哪种情况会比 运行 更快
还有其他方法吗?
此致
在高层次上,由于您的 table 上的数据计数相对较高,建议不要使用 SET tables,而是使用 multiset [=14] =].
有关更多信息,您可以参考此 link
http://www.dwhpro.com/teradata-multiset-tables/
您为什么关心重复行?当您存储每周聚合时,根本不应该有重复项。并且重复行与重复主键值不同。
只需选择最适合您的 join/access 模式的圆周率(可能按日期划分)。为避免任何潜在的重复,您可以简单地使用 MERGE 而不是 INSERT。
我必须准备一个 table,我将在其中保存一些汇总数据的每周结果。 Table 将有 30 个字段(10 个字符,20 个小数),我想我每周会有 25 万行。
在我的脑海中,我可以看到两种情况:
- 设置 table 并依靠 teradata 来防止重复行 - 它应该在插入新数据时跳过重复条目
- 带有 UPI 的多集 table - 插入重复行时会出错。
INSERT 语句将在 excel 上通过 VBA 执行,其中处理可能的 teradata 错误不是问题。
在一年内大约有 1400 万行
,哪种情况会比 运行 更快还有其他方法吗?
此致
在高层次上,由于您的 table 上的数据计数相对较高,建议不要使用 SET tables,而是使用 multiset [=14] =]. 有关更多信息,您可以参考此 link
http://www.dwhpro.com/teradata-multiset-tables/
您为什么关心重复行?当您存储每周聚合时,根本不应该有重复项。并且重复行与重复主键值不同。
只需选择最适合您的 join/access 模式的圆周率(可能按日期划分)。为避免任何潜在的重复,您可以简单地使用 MERGE 而不是 INSERT。