忽略 r 中因子变量的频率大小写
ignore case in frequency for factor variable in r
我正在尝试使用 table
获取一列中因子的频率,但 我意识到有些因子虽然字母相同但大小写不同,即大写字母/小写字母 如附图所示。我在 excel 中使用 pivot table 检查了每个因素的频率(如下面的屏幕截图所示。
这是我的工作数据集 (Link)
我使用了foillowing代码
table ( data$new.Article.Subspecialty)
我尝试了以下方法,但它给了我错误。
table (数据$new.Article.Subspecialty,ignore.case=T)
Error in table(data$Article.Subspecialty, ignore.case = T) : all
arguments must have the same length
无论如何都要解决这个问题(可能会像 LINK 中那样将它们大写)但这是我的大数据集中的一个列。
任何建议将不胜感激。
table
没有 ignore.case
作为参数。我们可以使用 tolower
或 toupper
转换为相同的大小写,然后应用 table
table(tolower(data$new.Article.Subspecialty))
我正在尝试使用 table
获取一列中因子的频率,但 我意识到有些因子虽然字母相同但大小写不同,即大写字母/小写字母 如附图所示。我在 excel 中使用 pivot table 检查了每个因素的频率(如下面的屏幕截图所示。
这是我的工作数据集 (Link)
我使用了foillowing代码
table ( data$new.Article.Subspecialty)
我尝试了以下方法,但它给了我错误。 table (数据$new.Article.Subspecialty,ignore.case=T)
Error in table(data$Article.Subspecialty, ignore.case = T) : all arguments must have the same length
无论如何都要解决这个问题(可能会像 LINK 中那样将它们大写)但这是我的大数据集中的一个列。
任何建议将不胜感激。
table
没有 ignore.case
作为参数。我们可以使用 tolower
或 toupper
转换为相同的大小写,然后应用 table
table(tolower(data$new.Article.Subspecialty))