如何最好地为具有 "multiple categories" 的画面构建 csv 数据?
How to best structure csv data for tableau that has "multiple categories"?
我有一组 100 个“学生记录”,我希望每个 "favorite_food_type" 和 "favorite_food" 都有复选框,选中的那个将过滤一个 "bar graph" 计算数量包含特定 "favorite_food"type" 和 "favorite_food" 架构的报告可能是:
名字
favorite_food_type(例如蔬菜)
favorite_food(例如香蕉)
我希望在仪表板中能够 select 通过复选框,“给我所有 COUNT OF DISTINCT students with favorite_food of banana, apple, pear“并过滤所有图表记录。我的问题是针对单个学生的记录,也许一个学生同时喜欢香蕉和苹果。我如何最好地捕捉到它?我应该:
案例A:重复记录(这捕获了两个不同的“favorite_food”,但现在我必须弄清楚有多少学生(这是一个学生)
姓名,FAVORITE_FOOD_TYPE,水果
查理,水果,苹果
查理,水果,梨
CASE B:单条记录(这捕获了两个不同的“favorite_food”,但是有没有办法从分隔符中挑选出来?)
姓名,FAVORITE_FOOD_TYPE,水果
查理,水果,苹果#Pear
案例 C:每个水果的列(这为每个学生捕获一条记录,但每个水果需要大量的列,很多都是错误的)
名称,FAVORITE_FOOD_TYPE,苹果,香蕉,菠萝,梨
查理,水果,对,错,对,错
我想尽可能简单地做到这一点。
尽可能避免情况 B。重复信息几乎总是通过重复行来最好地处理——不是通过将多个值塞入单个 table 单元格,也不是通过创建多个列,例如 Favorite_1 和 Favorite_2
如果您在一个字段中提供了具有多个值的数据,Tableau 确实具有可用于将单个字段拆分为其组成部分以形成多个字段的函数和数据连接功能。这适用于固定数量的不同类型的信息——比如将城市、州字段拆分为城市和州的单独字段。
尽可能避免案例 C。这种交叉表结构使得分析数据和制作有用的可视化变得困难。每个值都被视为一个单独的字段。
如果为您提供了交叉表格式的数据,Tableau 允许您在数据连接窗格中旋转数据,以重塑为具有更少列和更多行的表单。
情况 A 通常是最好的方法。 您可以通过将重复信息分解为单独的 table 来进一步简化它——这一过程称为规范化。然后您可以使用联接重新组合 table 并在需要时查看重复信息。
您的示例的规范化方法将有两个 table(或 excel 中的制表符)。第一个 table 每个学生只有一行,两列:姓名和 favorite_food_type。第二个 table 每个 student/favorite 食物组合都有一行,有 2 列:名称和 favorite_food。现在每个学生都可以拥有任意数量的喜欢的食物或 none。由于两列都有一个名称字段,这将是在需要时用于连接(组合)table 的键。
鉴于 table 设计,您可以在 Tableau 中拥有 2 个数据源。第一个仅指向学生 table,可用于创建仅涉及学生和 favorite_food_type 的可视化。第二个数据源将使用(左)连接从两个 table 中读取,并可用于查看最喜欢的食物。使用第二个数据源时,您必须小心报告有关学生姓名和最喜欢的食物类型的信息,以说明重复信息。所以尽可能使用第一个数据源。最后,您可以将两种可视化效果放在仪表板上,并使用筛选器和突出显示操作来实现无缝交互,尽管有两个源 - 两全其美。
我有一组 100 个“学生记录”,我希望每个 "favorite_food_type" 和 "favorite_food" 都有复选框,选中的那个将过滤一个 "bar graph" 计算数量包含特定 "favorite_food"type" 和 "favorite_food" 架构的报告可能是:
名字 favorite_food_type(例如蔬菜) favorite_food(例如香蕉)
我希望在仪表板中能够 select 通过复选框,“给我所有 COUNT OF DISTINCT students with favorite_food of banana, apple, pear“并过滤所有图表记录。我的问题是针对单个学生的记录,也许一个学生同时喜欢香蕉和苹果。我如何最好地捕捉到它?我应该:
案例A:重复记录(这捕获了两个不同的“favorite_food”,但现在我必须弄清楚有多少学生(这是一个学生) 姓名,FAVORITE_FOOD_TYPE,水果 查理,水果,苹果 查理,水果,梨
CASE B:单条记录(这捕获了两个不同的“favorite_food”,但是有没有办法从分隔符中挑选出来?) 姓名,FAVORITE_FOOD_TYPE,水果 查理,水果,苹果#Pear
案例 C:每个水果的列(这为每个学生捕获一条记录,但每个水果需要大量的列,很多都是错误的) 名称,FAVORITE_FOOD_TYPE,苹果,香蕉,菠萝,梨 查理,水果,对,错,对,错
我想尽可能简单地做到这一点。
尽可能避免情况 B。重复信息几乎总是通过重复行来最好地处理——不是通过将多个值塞入单个 table 单元格,也不是通过创建多个列,例如 Favorite_1 和 Favorite_2
如果您在一个字段中提供了具有多个值的数据,Tableau 确实具有可用于将单个字段拆分为其组成部分以形成多个字段的函数和数据连接功能。这适用于固定数量的不同类型的信息——比如将城市、州字段拆分为城市和州的单独字段。
尽可能避免案例 C。这种交叉表结构使得分析数据和制作有用的可视化变得困难。每个值都被视为一个单独的字段。
如果为您提供了交叉表格式的数据,Tableau 允许您在数据连接窗格中旋转数据,以重塑为具有更少列和更多行的表单。
情况 A 通常是最好的方法。 您可以通过将重复信息分解为单独的 table 来进一步简化它——这一过程称为规范化。然后您可以使用联接重新组合 table 并在需要时查看重复信息。
您的示例的规范化方法将有两个 table(或 excel 中的制表符)。第一个 table 每个学生只有一行,两列:姓名和 favorite_food_type。第二个 table 每个 student/favorite 食物组合都有一行,有 2 列:名称和 favorite_food。现在每个学生都可以拥有任意数量的喜欢的食物或 none。由于两列都有一个名称字段,这将是在需要时用于连接(组合)table 的键。
鉴于 table 设计,您可以在 Tableau 中拥有 2 个数据源。第一个仅指向学生 table,可用于创建仅涉及学生和 favorite_food_type 的可视化。第二个数据源将使用(左)连接从两个 table 中读取,并可用于查看最喜欢的食物。使用第二个数据源时,您必须小心报告有关学生姓名和最喜欢的食物类型的信息,以说明重复信息。所以尽可能使用第一个数据源。最后,您可以将两种可视化效果放在仪表板上,并使用筛选器和突出显示操作来实现无缝交互,尽管有两个源 - 两全其美。