FP-growth 允许的输入数据类型是什么?
What are FP-growth allowed input data type?
我想从我的数据中挖掘频繁模式。然而,我的数据集非常大。首先,我需要将其转换为事务数据库格式。问题是在我的数据库(500000 条记录)中,有 402 个独特的重复项。我到处都看到 fp-growth 示例,其数据集最多包含 8 个字符(A、B、C、D、E、F、G、H),但是我需要代表 402 个独特的项目。我可以为此算法使用字母字符的组合吗?或者还有其他方法吗?
谢谢大家
取决于您的实施。
但是允许 'milk' 之类的项目而不是只有一个字母的项目是相当标准的。
我想从我的数据中挖掘频繁模式。然而,我的数据集非常大。首先,我需要将其转换为事务数据库格式。问题是在我的数据库(500000 条记录)中,有 402 个独特的重复项。我到处都看到 fp-growth 示例,其数据集最多包含 8 个字符(A、B、C、D、E、F、G、H),但是我需要代表 402 个独特的项目。我可以为此算法使用字母字符的组合吗?或者还有其他方法吗? 谢谢大家
取决于您的实施。
但是允许 'milk' 之类的项目而不是只有一个字母的项目是相当标准的。