Tableau - 连接多个文件(混合或连接?)

Tableau - joining several files (blend or join?)

我一直在使用 pandas 创建 .csv 文件以连接到 Tableau。如果可能的话,我想纯粹在 Tableau 中完成,这样我就可以将每日更新外包给同事,而不必教他 python/pandas.

文件 A:每月 120 万行,每行代表与客户的一次交互,它包含以下列,我将它们合并在一起以获得唯一值(这并不完美,因为有时有多行具有不同的时间戳对于相同的交互 - 我通常会在这三个字段上删除重复项 (countd(Date+PersonID+CustomerID)):

Date | PersonID | CustomerID 

文件 B:每月 30 万行。这表示如果 PersonID 在与 CustomerID 交互时有问题,他们会联系另一个人。我还创建了一个字段 (Date+PersonID+CustomerID) 以加入文件 A。

Date | PersonID | CustomerID | HelperID

文件 C:每月 20 万行。这是文件 C 的子集,具有一些不同的信息,但没有 PersonID。我通常执行 (Date+CustomerID),然后查找文件 A 中的 PersonID 是谁以及该信息。

日期 |客户ID | HelperID

最后我有一个整体文件(outerjoins),然后是一个较小的文件,其中有关于相同交互的直接匹配,我可以说这个 PersonID 与这个 CustomerID 交互并且需要这个 HelperID 在这个日期的帮助某些问题。

如何在 Tableau 中直接处理此问题?我应该分别加载所有三个文件并在 CustomerID 上混合吗?我应该在每个文件上创建唯一的串联字段然后进行连接吗?它并不完美,因为没有直接将这些文件 1 到 1 链接的索引或键。我害怕做左连接和膨胀数字(我注意到有时有重复,我不知道如何解决它加入 Tableau)

联接比混合更灵活、性能更好,因此如果您有选择,最好选择联接。

为了能够使用联接(或自定义 SQL),数据需要位于同一 Excel 电子表格的(可能是多个)选项卡中或数据库中的表格中。两者都可以从 CSV 加载。

混合的主要用例是当您需要组合从不同数据源提取的信息时——例如将 Oracle 数据库中的数据与电子表格中的其他数据进行比较。

在 Tableau 9 之前,混合也是为数不多的用于组合从同一数据库中提取的信息的方法之一,但使用返回不同详细级别信息的查询——例如将各个商店位置的指标与指标进行比较对于封闭区域。

Tableau 9 引入了详细程度 (LOD) 计算,它比数据混合更能处理该用例。