查找相似特征/产品组合的模式(最好在 python 中)

Find Patterns of similar features / product combinations (preferably in python)

假设我有一个具有以下结构(800k 条记录)的 csv 文件,我想识别产品组合的现有模式(例如,产品 XYZ 经常组合在一起的模式):

Customer_ID | Product_ID | Revenue
    1             A          X
    1             B          X
    1             C          X
    2             A          X
    2             D          X
    3             A          X
    4             F          X

你会如何从数据科学的角度来处理这个问题?您将使用哪些方法以及您需要采取哪些步骤(例如,您推荐的方法的伪代码,最好在 python 中)。

非常感谢您的帮助。非常感谢! 问候 西蒙

有一个标准的数据挖掘任务称为

频繁项集挖掘

又名购物篮分析。

它查看经常一起购买的产品。

你真的应该先阅读一些基础书籍和维基百科...