R 中的子集数据和绘图

Subset data and plotting in R

我想使用 R 对大型数据集(超过 100 000 个值)进行简化和子集化,然后绘制它们。下面是我的数据集(图 1)的简化版本,我将其分为三年和两种作物类型。我有一年(2011-2013),两种作物类型(玉米和大豆)及其总面积。

我想将数据按年份划分为玉米和大豆的总面积,并将年份、类型和总面积划分为新的 table(示例图 2),然后按年份绘制总面积对于每个(图 3 中的绘图示例)。

图 1 小示例数据集

图 2 新总数 table

图 3 我要生成的图表示例

我想我可以按年份对数据进行子集化并使用

进行裁剪

corn2011 <- subset(CropTable, Year==2011 & Lulc=="Corn")

corn2012 <- subset(CropTable, Year==2012 & Lulc=="Corn")

然后我可以使用求和函数汇总数据

sum(corn2011[3]),

但我不确定如何每年绘制它们或相互对照以使其看起来像图 3。

对于你的情节,你可以试试这个

data.df <- read.table(text="
   Year            Type Area
1       2011 corn  30
2       2012 corn  15
3       2013 corn  50
4       2011 Soy  45
5       2012 Soy  30
6       2013 Soy  60",
  header = TRUE)

ggplot(data=data.df, aes(x=as.factor(Year), y=Area, group=Type, color=Type)) + geom_line() + xlab("Year") + ylab("Area (ha)") + theme_bw() + scale_color_manual(values=c("red", "blue"))