SAS proc boxplot 绘制多个变量

SAS proc boxplot plot multiple variables

我试图使用箱线图来检查分类变量和多个数值变量之间的关系。我正在使用来自 kaggle 的乳腺癌数据集: https://www.kaggle.com/uciml/breast-cancer-wisconsin-data

数据有第 'diagnosis' 列作为分类 criteria/dependent 变量(分类)和 30 个其他列(全部为数字)作为解释变量,例如 'radius_mean' 'radius_se' 'radius_worst'等

我的问题不是按名称列出所有 30 个变量

'plot (radius_mean radius_se ... )*diagnosis;',

有没有一种方法可以使用更简单的命令来引用所有 30 个变量名称?

谢谢!

直接使用系统视图VCOLUMN询问sas本身有哪些字段

proc sql
    select name
    into :num_vars separated by ' '
    from SASHELP.VCOLUMN
    where libname = 'YOUR_LIB'              /* upper case */
      and memname = 'YOUR_MEMBER'           /* upper case */
      and name not in ('id', 'diagnosis'); /* correct case */
quit;

这将创建一个宏变量,其中列出了您需要的所有变量

%put &num_vars;

现在使用它

proc boxplot data=YOUR_LIB.YOUR_MEMBER;
    plot (&num_vars)*diagnosis; 
run;