基于 Tableau Prep 中的两个字段进行重复数据删除
De-duplicating based off two fields in Tableau Prep
如果我有以下包含两个字段的数据,Person ID 和 Action Date:
Example Data
我想删除重复的 ID 行,但保留最新日期的行。
我尝试了各种基于 COUNTD
的计算过滤器,但老实说我很困惑。
创建计算字段[过滤器]:
{FIXED [Person ID]: MAX([Action Date])} = [Action Date]
然后将其放在过滤器架上,select仅使用真值。最后右键单击过滤器架上的这个药丸,然后 select 添加到上下文
试试这个:
创建一个计算字段并在下面写table计算:
IF WINDOW_MAX(MAX([Action Date])) = MAX([Action Date])
THEN TRUE
ELSE FALSE
END
将 table 计算为 Specify Dimensions
并为每个 ID
重置
现在在过滤器中使用它并检查 True
在 Tableau Prep 中,使用 Aggregate
步骤。将 人员 ID 放入 Grouped Fields
并将 操作日期 放入 Aggregated Fields
。 Aggregated Fields
中的操作选择MAX
。
如果我有以下包含两个字段的数据,Person ID 和 Action Date: Example Data
我想删除重复的 ID 行,但保留最新日期的行。
我尝试了各种基于 COUNTD
的计算过滤器,但老实说我很困惑。
创建计算字段[过滤器]:
{FIXED [Person ID]: MAX([Action Date])} = [Action Date]
然后将其放在过滤器架上,select仅使用真值。最后右键单击过滤器架上的这个药丸,然后 select 添加到上下文
试试这个:
创建一个计算字段并在下面写table计算:
IF WINDOW_MAX(MAX([Action Date])) = MAX([Action Date])
THEN TRUE
ELSE FALSE
END
将 table 计算为 Specify Dimensions
并为每个 ID
现在在过滤器中使用它并检查 True
在 Tableau Prep 中,使用 Aggregate
步骤。将 人员 ID 放入 Grouped Fields
并将 操作日期 放入 Aggregated Fields
。 Aggregated Fields
中的操作选择MAX
。