这是什么类型的日期格式,我如何在 SPSS 中解析它?

What kind of date format is this, and how do I parse it in SPSS?

1037112:00:00.00是一种什么样的日期格式,如何在 SPSS 中将其解析为可识别的格式?

供参考,下面是屏幕截图。我们正在处理 V2 和 V4(在某种程度上,还有 V3 和 V5):

编辑: 当我将 SPPS 中的 V2 格式从 Date 更改为 Numeric , 高亮单元格实际个数为3733603200:

我将数据导入 SPSS 的文件格式是 Excel — 尽管日期在 Excel 中正确呈现(如“23-Apr”),但我怀疑 Excel 是创建此数据集的原始格式。数据是从在线调查中导出的;我希望我有更多关于它的信息。

这是在 Excel 中呈现的 V2 列的值(单元格格式为 "General"):

Excel 将日期存储为十进制数。整数部分是自 1 Jan 1900 以来的天数,而小数部分是自午夜以来的天数(0.5 表示中午)。如果您要格式化单元格以包含年份,您会发现突出显示的单元格已转换为 23 Apr 2018 00:00:00 - 完美!

如果你看原始数字,它是 3,733,603,200。将其除以 60 以将秒转换为分钟,然后再除以 60 以将分钟转换为小时 - 您将得到问题中的确切数字:1,037,112 小时,00分钟 00.0 秒。

如果您随后将此数字除以 24 以将小时数转换为天数,您将(准确地)得到 43,213。如果您要求 Excel 将此数字格式化为完整日期的单元格,您将得到之前的 23 Apr 2018 - 从 1900 年 1 月 1 日到 2018 年 4 月 23 日共有 43,213 天。

SPSS 日期变量在内部存储为自 14 Oct 1582 00:00:00 以来 的数量,因此您(通常)必须做一些复杂的数学运算!幸运的是,您只需添加两个“纪元”之间的天数 - 115,859 - 但不要忘记将其转换为秒!先乘以 24 * 60 * 60 (10,010,217,600).

请注意 V3 和 V5 不是 24 小时制。有些标记为“am”,因此 18 必须是月份的日期,而不是小时 - 还要注意缺少冒号!


我忍不住:我不得不添加这个额外的位。

为什么IBM选择了这么奇葩的起点? 14 Oct 1582 恰好是(当时的)新公历的第一天,由教皇格雷戈里二世制定。前一天是 5 Oct 1582 - 计算那些缺失的日子会产生一些 可怕的 数学,所以 IBM 只是避免了它。

缺失的天数是为了弥补所有错误的额外天数,他们在前几个世纪为闰年添加了不应该添加的天数(那些年可能会分开100,但不是 400)。