R 中的 colorRampPalette 多于 2 个簇

colorRampPalette in R more than 2 clusters

我想根据与点相关联的概率函数,以模糊的方式为我的点着色。

我已经处理了 2 个案例。首先,我正在构建我的数据集和给定 2 个集群的相关概率。

set.seed(16)
rbPal <- colorRampPalette(c('yellow','red')) 
(mu1<-c(0,0))                  # vector mean multinom 1
(S1<-matrix(c(0.1,0,0,0.6),2)) # var/cov matrix multinom 1
(mu2<-c(3,0))                  # vector mean multino 2
(S2<- matrix(c(1,0,0,0.1),2))  # var/cov matrix multinom 2

x1<-mvrnorm(n=100, mu=mu1,Sigma=S1 )
x2<-mvrnorm(n=100, mu=mu2,Sigma=S2 )

x<-rbind(x1,x2)              # Dataset

euc.dist<-function (a,b){
sqrt(sum((a-b)^2))
}

randC<-x[sample(nrow(x),2),]
Distmatrix<- t(apply(x,1,function(r) apply(randC,1, function(s) euc.dist(r, 
s))))
mat<-matrix(,200,2)
mat<-apply(mat,2,function(x) x=apply(Distmatrix,1, prod))/Distmatrix

P<-t(apply(mat, 1, function(x) x/sum(x)))
D4<-data.frame(x,P)

D4$Col <- rbPal(10)[as.numeric(cut(D4$X1.1,breaks = 10))]


plot(D4$X1,D4$X2,pch = 20,col = D4$Col, cex=1.2) 
points(randC, col="red")

这就是我想象的 2 个点作为簇的质心。

如果我想做同样的颜色工作想象超过 2 个集群怎么办?

所以我应该:

[...]
set.seed(50)
rbPal <- colorRampPalette(c('yellow','red',"green"))
mat<-matrix(,200,3) 
randC<-x[sample(nrow(x),3),]
Distmatrix<- t(apply(x,1,function(r) apply(randC,1, function(s) euc.dist(r, 
s))))

mat<-apply(mat,2,function(x) x=apply(Distmatrix,1, prod))/Distmatrix

P<-t(apply(mat, 1, function(x) x/sum(x)))
D4<-data.frame(x,P)

D4$Col <- rbPal(10)[as.numeric(cut(D4$X1.1,breaks = 10))]


plot(D4$X1,D4$X2,pch = 20,col = D4$Col, cex=1.2) 
points(randC, col="red")

错了,因为我希望每个质心都具有颜色的最大值,然后根据距离根据哪个簇进行着色。

可能需要自己做混音功能

如果你有两个以上的集群,线性颜色 space 就不够了。

最简单的选择是在每个组件中进行线性混合。直接实施。对于更高级的情况,您可能希望 "balanced" 个点(所有距离都相等)为灰色,而不是平均颜色。

作为临时解决方案,您还可以为每个集群设置调色板,从灰色到集群颜色。然后用第i个调色板的(x_j-x_i)/x_j作为值,其中x_i是最小的,x_j是第二小的值。如果 x_i=x_j,该值将为 0(灰色)。如果x_i=0,则值为1。

这可能非常漂亮,但可能会产生误导,因为它并没有在所有地方使用相同的缩放比例。

我想我找到了一个很好的解决方案,这是原因:

set.seed(50)
mat<-matrix(,200,3) 
randC<-x[sample(nrow(x),3),]
Distmatrix<- t(apply(x,1,function(r) apply(randC,1, function(s) euc.dist(r, 
                                                                         s))))

mat<-apply(mat,2,function(x) x=apply(Distmatrix,1, prod))/Distmatrix

P<-t(apply(mat, 1, function(x) x/sum(x)))
D4<-data.frame(x,P)


rbPal<-list()
for(i in 1:k){
  rbPal[[i]] <- colorRampPalette(c('white',col=I(i+1)))
}
for(i in 1:k){
  D4[[dim(D4)[2]+1]] <- rbPal[[i]](10)[as.numeric(cut(D4[[2+i]],breaks = 10))]
}


for(i in 1:k){
  D4[[dim(D4)[2]+1]]<-t(col2rgb(D4[[dim(D4)[2]-k+1]])) 
}

prova<-matrix(0,dim(D4)[1],3)
for(i in 1:k){
  prova<-prova+D4[,(dim(D4)[2]-k+i)]*P[,i]
}
prova[is.nan(prova)] <- 0
provcol=apply(prova,1, function(x) rgb(x[1], x[2], x[3], maxColorValue=255))
plot(D4$X1,D4$X2,pch = 20,col = provcol, cex=1.5) 
points(randC, col="red")

我基本上创建了 k 个不同的调色板,每个调色板都是从白色开始的,这是每个人的共同颜色。然后我根据概率,把这k个簇概率的rgb值进行了加权混合。