在 ggplot2 中格式化 Geom_Bar
Formatting Geom_Bar in ggplot2
您好,我在弄清楚如何正确格式化我尝试在 ggplot2 中生成的堆积条形图时遇到了一些问题。我尝试搜索以前的问题,但其中 none 似乎回答了我 运行 遇到的问题。 Geom_Bar using 1 + 2 as dummy variables
在第一个附加图表中,我接近图表中我想要的,但侧面的刻度显示 5 个值与('1' 和 '2'),这是框架中仅有的两个变量。本质上,我试图将填充比例修复为仅具有“1”和“2”值,如果可以将它们编辑为 'Yes' 和 'No' 下面我附上了代码:
ggplot(AggSignedDummyVar, aes(fill=AggSignedDummyVar$`Signed by Drafting Club`, x = AggSignedDummyVar$`College Conference`, y = MLS_Draft_File$`Signed by Drafting Club`)) +
xlim('American Athletic Conference', 'Atlantic-10 Conference', 'Atlantic Coast Conference', 'Big East Conference', 'Big West Conference', 'Ivy League', 'Mid-American Conference', 'Pac-12 Conference', 'West Coast Conference')
我还尝试使用('Yes' 和 'No')重写上面的代码,而不是上面代码中的虚拟变量。此部分似乎包含出现次数,但不显示它们并将 'Yes' 和 'No' 附加到 Y 轴的下部(不应该在那里)。 Geom_bar but without Dummy Variable。我已将代码附加到下面:
ggplot(MLS_Draft_File_Aggregated_Non_Numeric_, aes(fill=MLS_Draft_File_Aggregated_Non_Numeric_$`Signed by Drafting Club`, x = MLS_Draft_File_Aggregated_Non_Numeric_$`College Conference`, y = MLS_Draft_File_Aggregated_Non_Numeric_$`Signed by Drafting Club`)) +
xlim('American Athletic Conference', 'Atlantic-10 Conference', 'Atlantic Coast Conference', 'Big East Conference', 'Big West Conference', 'Ivy League', 'Mid-American Conference', 'Pac-12 Conference', 'West Coast Conference')
希望我能正确解释这一点,并提前感谢您提供的任何帮助。
如果您为 ggplot::aes
函数提供变量,ggplot
会尝试猜测 如何 您要使用此数据。如果数据是数字,它会将其用作连续变量,即使只有 2 个不同的值。如果你提供一个离散变量 ggplot
相应地使用它。
考虑以下两个图:
library(ggplot2)
ggplot(mtcars, aes(x=mpg, y=hp, fill=cyl)) + geom_bar(stat="identity")
fill
的变量是数字 -> ggplot
将其视为连续变量
但是这里:
ggplot(mtcars, aes(x=mpg, y=hp, fill=factor(cyl))) + geom_bar(stat="identity")
我们在将 cyl
传递给 aes
之前将其重新转换为一个因子(我们也可以使用字符,但因子的优点是我们可以指定级别的顺序。这个顺序将被 ggplot
)
使用
您好,我在弄清楚如何正确格式化我尝试在 ggplot2 中生成的堆积条形图时遇到了一些问题。我尝试搜索以前的问题,但其中 none 似乎回答了我 运行 遇到的问题。 Geom_Bar using 1 + 2 as dummy variables 在第一个附加图表中,我接近图表中我想要的,但侧面的刻度显示 5 个值与('1' 和 '2'),这是框架中仅有的两个变量。本质上,我试图将填充比例修复为仅具有“1”和“2”值,如果可以将它们编辑为 'Yes' 和 'No' 下面我附上了代码:
ggplot(AggSignedDummyVar, aes(fill=AggSignedDummyVar$`Signed by Drafting Club`, x = AggSignedDummyVar$`College Conference`, y = MLS_Draft_File$`Signed by Drafting Club`)) +
xlim('American Athletic Conference', 'Atlantic-10 Conference', 'Atlantic Coast Conference', 'Big East Conference', 'Big West Conference', 'Ivy League', 'Mid-American Conference', 'Pac-12 Conference', 'West Coast Conference')
我还尝试使用('Yes' 和 'No')重写上面的代码,而不是上面代码中的虚拟变量。此部分似乎包含出现次数,但不显示它们并将 'Yes' 和 'No' 附加到 Y 轴的下部(不应该在那里)。 Geom_bar but without Dummy Variable。我已将代码附加到下面:
ggplot(MLS_Draft_File_Aggregated_Non_Numeric_, aes(fill=MLS_Draft_File_Aggregated_Non_Numeric_$`Signed by Drafting Club`, x = MLS_Draft_File_Aggregated_Non_Numeric_$`College Conference`, y = MLS_Draft_File_Aggregated_Non_Numeric_$`Signed by Drafting Club`)) +
xlim('American Athletic Conference', 'Atlantic-10 Conference', 'Atlantic Coast Conference', 'Big East Conference', 'Big West Conference', 'Ivy League', 'Mid-American Conference', 'Pac-12 Conference', 'West Coast Conference')
希望我能正确解释这一点,并提前感谢您提供的任何帮助。
如果您为 ggplot::aes
函数提供变量,ggplot
会尝试猜测 如何 您要使用此数据。如果数据是数字,它会将其用作连续变量,即使只有 2 个不同的值。如果你提供一个离散变量 ggplot
相应地使用它。
考虑以下两个图:
library(ggplot2)
ggplot(mtcars, aes(x=mpg, y=hp, fill=cyl)) + geom_bar(stat="identity")
fill
的变量是数字 -> ggplot
将其视为连续变量
但是这里:
ggplot(mtcars, aes(x=mpg, y=hp, fill=factor(cyl))) + geom_bar(stat="identity")
我们在将 cyl
传递给 aes
之前将其重新转换为一个因子(我们也可以使用字符,但因子的优点是我们可以指定级别的顺序。这个顺序将被 ggplot
)