Google Analytics API 下载多个维度 - 数量随着维度的增加而减少
Google Analytics API download of multiple dimensions - numbers decrease with more dimensions
我在这个 GA 问题上进退两难。我有许多自定义维度,包括用户标识符、浏览器时间戳和部分名称。我正在使用带有 Python 的 v4 API 从 GA 下载结果。
当我下载用户 ID(连同 ga:eventCategory、ga:eventAction 和 ga:eventLabel)时,一天大约有 12K 行,我认为这是正确的。当我添加时间戳时,数字如预期的那样增加到大约 15K 行。
但是当我添加最终的自定义维度、部分名称时,数字 减少了 。据说维度总是被传递和定义。
这对我来说是违反直觉的。为什么在批量查询中添加另一个维度时行数会减少?
这里的问题是最终自定义维度 并非 始终定义。因此,当我将另一个维度添加到批处理查询时,未定义维度的行丢失了。
这应该在 Google Analytics 文档中以大写字母拼写:如果您不定义维度,则在查询该维度时会丢失该行。永远不应该有一个空值,而是使用类似 UNDEFINED 的东西。然后您可以在您的下载中搜索该关键字。
为了找到这个问题,我将除最终维度之外的所有结果下载到一个文件 all_but_section.csv。然后我将所有具有最终维度的结果下载到文件 all_with_section.csv。我从 CSV 中删除了部分列。使用一些 UNIX 技巧,这会为您提供缺少维度的行:
cat all_but_section.csv all_with_section.csv | sort | uniq -u
如果有人感兴趣,我还可以提供一个 python 我为提取列而构建的小脚本。
我在这个 GA 问题上进退两难。我有许多自定义维度,包括用户标识符、浏览器时间戳和部分名称。我正在使用带有 Python 的 v4 API 从 GA 下载结果。
当我下载用户 ID(连同 ga:eventCategory、ga:eventAction 和 ga:eventLabel)时,一天大约有 12K 行,我认为这是正确的。当我添加时间戳时,数字如预期的那样增加到大约 15K 行。
但是当我添加最终的自定义维度、部分名称时,数字 减少了 。据说维度总是被传递和定义。
这对我来说是违反直觉的。为什么在批量查询中添加另一个维度时行数会减少?
这里的问题是最终自定义维度 并非 始终定义。因此,当我将另一个维度添加到批处理查询时,未定义维度的行丢失了。
这应该在 Google Analytics 文档中以大写字母拼写:如果您不定义维度,则在查询该维度时会丢失该行。永远不应该有一个空值,而是使用类似 UNDEFINED 的东西。然后您可以在您的下载中搜索该关键字。
为了找到这个问题,我将除最终维度之外的所有结果下载到一个文件 all_but_section.csv。然后我将所有具有最终维度的结果下载到文件 all_with_section.csv。我从 CSV 中删除了部分列。使用一些 UNIX 技巧,这会为您提供缺少维度的行:
cat all_but_section.csv all_with_section.csv | sort | uniq -u
如果有人感兴趣,我还可以提供一个 python 我为提取列而构建的小脚本。