在 sweetviz 比较中将整数列显示为分类和抛出错误
Showing integer columns as categorical and throwing error in sweetviz compare
如果我单独分析这两个数据集,我不会收到任何错误,而且我还会得到所有整数列的可视化。
但是当我尝试比较这些数据帧时,出现以下错误。
无法将 COMPARED 中的系列 'Web Visit' 从其 TYPE_CATEGORICAL 转换为
到所需的类型 TYPE_BOOL.
我也尝试过FeatureConfig跳过它,但无济于事。
pid_compare = sweetviz.compare([pdf,"234_7551009"],[pdf_2,"215_220941058"])
这里是库的维护者; in the git 也有人问过这个问题,但在这里详细说明答案会很有用。
查看上面 link 中提供的数据后,第一个数据帧 (pdf
) 似乎只包含 0 和 1,因此它被归类为布尔值,因此无法进行比较反对第二个是绝对的(你可能知道那个有 0,1,2,3!)。
如果您使用 FeatureConfig 强制将第一个数据帧视为 CATEGORICAL。
,系统将能够处理它
我刚刚尝试了以下方法,似乎有效,如果有帮助请告诉我!
feature_config = sweetviz.FeatureConfig(force_cat = ["Web Desktop Interaction"])
report = sweetviz.compare(pdf, pdf_2, None, feature_config)
如果我单独分析这两个数据集,我不会收到任何错误,而且我还会得到所有整数列的可视化。 但是当我尝试比较这些数据帧时,出现以下错误。
无法将 COMPARED 中的系列 'Web Visit' 从其 TYPE_CATEGORICAL 转换为 到所需的类型 TYPE_BOOL.
我也尝试过FeatureConfig跳过它,但无济于事。
pid_compare = sweetviz.compare([pdf,"234_7551009"],[pdf_2,"215_220941058"])
这里是库的维护者; in the git 也有人问过这个问题,但在这里详细说明答案会很有用。
查看上面 link 中提供的数据后,第一个数据帧 (pdf
) 似乎只包含 0 和 1,因此它被归类为布尔值,因此无法进行比较反对第二个是绝对的(你可能知道那个有 0,1,2,3!)。
如果您使用 FeatureConfig 强制将第一个数据帧视为 CATEGORICAL。
,系统将能够处理它我刚刚尝试了以下方法,似乎有效,如果有帮助请告诉我!
feature_config = sweetviz.FeatureConfig(force_cat = ["Web Desktop Interaction"])
report = sweetviz.compare(pdf, pdf_2, None, feature_config)