teradata uniform 中的示例命令
sample command in teradata uniform
只是想知道,teradata select 中的 SAMPLE 是否具有均匀的概率(即为每一行提供相同的 selected 概率)。示例:
select * from employee_table sample 8;
也会保证每次执行后返回的数据都不一样
每个 SAMPLE
都是随机的,但使用默认值并不是真正的简单样本。所有 AMP 进行通信以决定哪个 AMP 将返回多少行,即默认 SAMPLE
是 n 个单独样本的 UNION
,每个 AMP 一个。很难注意到,因为数据是散列分布的,但是带有 NUPI 的倾斜 table 可能对某些行进行采样的概率更高。
当您需要真正的随机样本时,您必须使用 SAMPLE RANDOMIZED ALLOCATION
选项,现在所有 AMP 的所有行都具有相同的概率。
但由于它是随机的,当然不能保证每个样本中有不同的行。
只是想知道,teradata select 中的 SAMPLE 是否具有均匀的概率(即为每一行提供相同的 selected 概率)。示例:
select * from employee_table sample 8;
也会保证每次执行后返回的数据都不一样
每个 SAMPLE
都是随机的,但使用默认值并不是真正的简单样本。所有 AMP 进行通信以决定哪个 AMP 将返回多少行,即默认 SAMPLE
是 n 个单独样本的 UNION
,每个 AMP 一个。很难注意到,因为数据是散列分布的,但是带有 NUPI 的倾斜 table 可能对某些行进行采样的概率更高。
当您需要真正的随机样本时,您必须使用 SAMPLE RANDOMIZED ALLOCATION
选项,现在所有 AMP 的所有行都具有相同的概率。
但由于它是随机的,当然不能保证每个样本中有不同的行。