从电子表格值计算一天中最常见的时间
Calculate most common time of day from spreadsheet values
初步
这个问题适用于任何电子表格系统。我想帮助解决问题,而不是解决问题。 (尽管后者最有用。)
我知道 Stack Overflow 对于特定的编程问题很有用,我知道我可能需要尝试几次才能解决我的问题,所以请通过提供建议帮助我澄清我的问题,我会更新它。
像许多数据新手一样,我对谨慎数据有很好的经验(例如上个月有多少查询),但我很难理解如何处理连续数据(例如如何发现模式,以及查询的标准在哪里还不知道)。
问题
我有一个电子表格,其中每一行代表一个 "website enquiry"。有一个日期时间列,我想发现此数据中的模式,以回答以下问题:
- 一天中最常收到询问的时间是什么时候
- 一周中哪一天最常收到询问
- 我可以从数据中收集到的其他有用信息,以允许我定位潜在客户
这类似于您在社交媒体分析中经常看到的功能,例如 "best time to tweet"。
我知道计算一周中最常见的一天非常简单,因为天是谨慎的对象。所以我不需要这方面的帮助!
我想避免简单地将一天分成四个任意时间段(例如早餐、午餐、晚餐、夜间)并计算落入这些范围内的行数。如果这些时间段不适合用来分割数据怎么办?
除了使用任意边界量化我的数据之外,还有其他方法吗?
您可以使用聚类找出最常见的时间。基本上,您比较查询的时间间隔并将它们聚类,就像使用例如平均链接聚类标准的离散一维数字集一样。当您到达数量相当少的集群时,您将开始看到一天中最主要的时间(如果您想评估这些时间,您可以采用最大集群的加权中心的时间值)。
初步
这个问题适用于任何电子表格系统。我想帮助解决问题,而不是解决问题。 (尽管后者最有用。)
我知道 Stack Overflow 对于特定的编程问题很有用,我知道我可能需要尝试几次才能解决我的问题,所以请通过提供建议帮助我澄清我的问题,我会更新它。
像许多数据新手一样,我对谨慎数据有很好的经验(例如上个月有多少查询),但我很难理解如何处理连续数据(例如如何发现模式,以及查询的标准在哪里还不知道)。
问题
我有一个电子表格,其中每一行代表一个 "website enquiry"。有一个日期时间列,我想发现此数据中的模式,以回答以下问题:
- 一天中最常收到询问的时间是什么时候
- 一周中哪一天最常收到询问
- 我可以从数据中收集到的其他有用信息,以允许我定位潜在客户
这类似于您在社交媒体分析中经常看到的功能,例如 "best time to tweet"。
我知道计算一周中最常见的一天非常简单,因为天是谨慎的对象。所以我不需要这方面的帮助!
我想避免简单地将一天分成四个任意时间段(例如早餐、午餐、晚餐、夜间)并计算落入这些范围内的行数。如果这些时间段不适合用来分割数据怎么办?
除了使用任意边界量化我的数据之外,还有其他方法吗?
您可以使用聚类找出最常见的时间。基本上,您比较查询的时间间隔并将它们聚类,就像使用例如平均链接聚类标准的离散一维数字集一样。当您到达数量相当少的集群时,您将开始看到一天中最主要的时间(如果您想评估这些时间,您可以采用最大集群的加权中心的时间值)。