SAS proc boxplot 绘制多个变量
SAS proc boxplot plot multiple variables
我试图使用箱线图来检查分类变量和多个数值变量之间的关系。我正在使用来自 kaggle 的乳腺癌数据集:
https://www.kaggle.com/uciml/breast-cancer-wisconsin-data
数据有第 'diagnosis' 列作为分类 criteria/dependent 变量(分类)和 30 个其他列(全部为数字)作为解释变量,例如 'radius_mean' 'radius_se' 'radius_worst'等
我的问题不是按名称列出所有 30 个变量
'plot (radius_mean radius_se ... )*diagnosis;',
有没有一种方法可以使用更简单的命令来引用所有 30 个变量名称?
谢谢!
直接使用系统视图VCOLUMN询问sas本身有哪些字段
proc sql
select name
into :num_vars separated by ' '
from SASHELP.VCOLUMN
where libname = 'YOUR_LIB' /* upper case */
and memname = 'YOUR_MEMBER' /* upper case */
and name not in ('id', 'diagnosis'); /* correct case */
quit;
这将创建一个宏变量,其中列出了您需要的所有变量
%put &num_vars;
现在使用它
proc boxplot data=YOUR_LIB.YOUR_MEMBER;
plot (&num_vars)*diagnosis;
run;
我试图使用箱线图来检查分类变量和多个数值变量之间的关系。我正在使用来自 kaggle 的乳腺癌数据集: https://www.kaggle.com/uciml/breast-cancer-wisconsin-data
数据有第 'diagnosis' 列作为分类 criteria/dependent 变量(分类)和 30 个其他列(全部为数字)作为解释变量,例如 'radius_mean' 'radius_se' 'radius_worst'等
我的问题不是按名称列出所有 30 个变量
'plot (radius_mean radius_se ... )*diagnosis;',
有没有一种方法可以使用更简单的命令来引用所有 30 个变量名称?
谢谢!
直接使用系统视图VCOLUMN询问sas本身有哪些字段
proc sql
select name
into :num_vars separated by ' '
from SASHELP.VCOLUMN
where libname = 'YOUR_LIB' /* upper case */
and memname = 'YOUR_MEMBER' /* upper case */
and name not in ('id', 'diagnosis'); /* correct case */
quit;
这将创建一个宏变量,其中列出了您需要的所有变量
%put &num_vars;
现在使用它
proc boxplot data=YOUR_LIB.YOUR_MEMBER;
plot (&num_vars)*diagnosis;
run;