如何绘制 R 中大数据缺失值的可视化?

How to plot visualization of missing values for big data in R?

我想为一个大数据(1000 个变量)绘制缺失值图,我试过 vis_miss 函数如下

library(naniar)
vis_miss(predictors, warn_large_data=TRUE)

但是,它在绘制绘图后显示变量名称,由于变量太多,几乎无法阅读,我想知道 1. 是否有任何方法可以从 x 轴上删除变量名称 2.大数据缺失值图的绘制还有其他漂亮的方法吗?

vis_miss() 函数是基于 ggplot 的,因此您可以相对轻松地更改它。

关于您的问题:

  1. if there is any way to remove variable names from the x axis

您可以使用例如

删除它们
vis_miss(predictors, warn_large_data=TRUE) +
  theme(axis.text.x = element_blank())

或使用例如

改变它们
vis_miss(predictors, warn_large_data=TRUE) +
  theme(axis.text.x = element_text(size = 6, angle = 60))

关于你的另一个问题:

  1. Is there any other beautiful way to draw a missing value plot for big data?

如果没有您的实际数据样本,很难说什么是最好的,但有一些建议,例如 gg_miss_upset() 此处:https://cran.r-project.org/web/packages/naniar/vignettes/naniar-visualisation.html