将对数据框中的行进行排序的跳跃/交替序列
jumping / alternating sequence that will ordner rows in dataframe
假设我有一个 ds 行:
cat
dog
lion
miau
wuff
roarr
我想按顺序订购它们
cat
miau
dog
wuff
lion
roarr
为了做到这一点,我需要按顺序订购它
1 4 2 5 3 6
让我们举一个更一般的例子,任意 n:
n <- 10
ds < data.frame(col=c(paste0(letters[1:n],1),paste0(letters[1:n],2)),stringsAsFactors = F)
ds[,] <- ds[mySeq,]
如何为所有类型的 n 生成该序列 (mySeq)?
> ds
col
1 a1
2 b1
3 c1
4 d1
5 e1
6 f1
7 g1
8 h1
9 i1
10 j1
11 a2
12 b2
13 c2
14 d2
15 e2
16 f2
17 g2
18 h2
19 i2
20 j2
>
编辑:
我可以想象压缩序列 1:(nrow(ds)/2) 和 (nrow(ds)/2+1):nrow(ds)。
所以如果 n 变得更高,我需要压缩很多 seqs。不太实用
gtools mixedsort() 不适用于 "random" 行:
set.seed(1337)
MHmakeRandomString <- function(n=1, lenght=12)
{
randomString <- c(1:n) # initialize vector
for (i in 1:n)
{
randomString[i] <- paste(sample(c(0:9, letters, LETTERS),
lenght, replace=TRUE),
collapse="")
}
return(randomString)
}
ds <- data.frame(col=c(paste0(MHmakeRandomString(n),1),paste0(MHmakeRandomString(n),2)),stringsAsFactors = F)
dso <- mixedsort(ds)
我想我确实需要那个序列!
我更新了我的第一个迷你示例!
我们可以使用sub
ds[order(sub("\D+", "", ds[,1])), , drop = FALSE]
怎么样:
n <- 10
ds <- data.frame(col=c(paste0(letters[1:n],1), paste0(letters[1:n],2)), stringsAsFactors = F)
mySeq <- order(substr(ds$col,1,1), substr(ds$col,2,2))
ds <- ds[mySeq,]
这是另一种方法,尝试根据其基础模式生成数字序列。这意味着没有字符串操作。
sequence_generator <- function(n, nrow){
base_seq=rep(1:n,each=nrow/n)
res=base_seq+seq(0,(nrow/n)-1)*n
res
}
sequence_generator(3,6)
# [1] 1 4 2 5 3 6
sequence_generator(10,20)
#[1] 1 11 2 12 3 13 4 14 5 15 6 16 7 17 8 18 9 19 10 20
假设我有一个 ds 行:
cat
dog
lion
miau
wuff
roarr
我想按顺序订购它们
cat
miau
dog
wuff
lion
roarr
为了做到这一点,我需要按顺序订购它
1 4 2 5 3 6
让我们举一个更一般的例子,任意 n:
n <- 10
ds < data.frame(col=c(paste0(letters[1:n],1),paste0(letters[1:n],2)),stringsAsFactors = F)
ds[,] <- ds[mySeq,]
如何为所有类型的 n 生成该序列 (mySeq)?
> ds
col
1 a1
2 b1
3 c1
4 d1
5 e1
6 f1
7 g1
8 h1
9 i1
10 j1
11 a2
12 b2
13 c2
14 d2
15 e2
16 f2
17 g2
18 h2
19 i2
20 j2
>
编辑: 我可以想象压缩序列 1:(nrow(ds)/2) 和 (nrow(ds)/2+1):nrow(ds)。 所以如果 n 变得更高,我需要压缩很多 seqs。不太实用
gtools mixedsort() 不适用于 "random" 行:
set.seed(1337)
MHmakeRandomString <- function(n=1, lenght=12)
{
randomString <- c(1:n) # initialize vector
for (i in 1:n)
{
randomString[i] <- paste(sample(c(0:9, letters, LETTERS),
lenght, replace=TRUE),
collapse="")
}
return(randomString)
}
ds <- data.frame(col=c(paste0(MHmakeRandomString(n),1),paste0(MHmakeRandomString(n),2)),stringsAsFactors = F)
dso <- mixedsort(ds)
我想我确实需要那个序列!
我更新了我的第一个迷你示例!
我们可以使用sub
ds[order(sub("\D+", "", ds[,1])), , drop = FALSE]
怎么样:
n <- 10
ds <- data.frame(col=c(paste0(letters[1:n],1), paste0(letters[1:n],2)), stringsAsFactors = F)
mySeq <- order(substr(ds$col,1,1), substr(ds$col,2,2))
ds <- ds[mySeq,]
这是另一种方法,尝试根据其基础模式生成数字序列。这意味着没有字符串操作。
sequence_generator <- function(n, nrow){
base_seq=rep(1:n,each=nrow/n)
res=base_seq+seq(0,(nrow/n)-1)*n
res
}
sequence_generator(3,6)
# [1] 1 4 2 5 3 6
sequence_generator(10,20)
#[1] 1 11 2 12 3 13 4 14 5 15 6 16 7 17 8 18 9 19 10 20