Pentaho 中的数据哈希

Data hashing in Pentaho

任何人都可以建议我可以在 pentaho 中使用的最佳选项以满足我的要求。需求是我们需要将 first_name & last_name 属性转换为散列并将这些列的散列值加载到用户 table 以支持业务报告。对于报告,不需要这些列的实际值,报告代码仅检查 first_name 和 last_name 列中的 NULL 值,并验证这些字段的长度。

我尝试使用添加校验和转换将字段转换为散列,但不确定要使用哪种类型的校验和(CRC 32、ADLER 32、MD5、SHA-1)。有什么建议吗?

源和目标数据库是 PostgreSql 不确定是否需要它。

提前致谢。

哈希和加密不是一回事。

您似乎想要一个单向哈希。您选择什么哈希值主要取决于您对碰撞的关心程度。如果您不关心多个名称可能会生成相同的散列,那么像 CRC32 这样的简短快速散列就可以了。如果您确实关心碰撞,那么我至少会使用 MD5。