在 sweetviz 比较中将整数列显示为分类和抛出错误

Showing integer columns as categorical and throwing error in sweetviz compare

如果我单独分析这两个数据集,我不会收到任何错误,而且我还会得到所有整数列的可视化。 但是当我尝试比较这些数据帧时,出现以下错误。

无法将 COMPARED 中的系列 'Web Visit' 从其 TYPE_CATEGORICAL 转换为 到所需的类型 TYPE_BOOL.

我也尝试过FeatureConfig跳过它,但无济于事。

pid_compare = sweetviz.compare([pdf,"234_7551009"],[pdf_2,"215_220941058"])

这里是库的维护者; in the git 也有人问过这个问题,但在这里详细说明答案会很有用。

查看上面 link 中提供的数据后,第一个数据帧 (pdf) 似乎只包含 0 和 1,因此它被归类为布尔值,因此无法进行比较反对第二个是绝对的(你可能知道那个有 0,1,2,3!)。

如果您使用 FeatureConfig 强制将第一个数据帧视为 CATEGORICAL

,系统将能够处理它

我刚刚尝试了以下方法,似乎有效,如果有帮助请告诉我!

feature_config = sweetviz.FeatureConfig(force_cat = ["Web Desktop Interaction"])
report = sweetviz.compare(pdf, pdf_2, None, feature_config)