无法解释的百分比错误计算法式轮盘估计
Unexplainable percentage error calculating French Roulette estimations
我正在为 class 做一个项目:它是关于四种不同的法式轮盘赌(37 个数字)策略的统计评估。
前两个很简单:
- 一个。赌红一次
- 乙。投注第一时间
请找到下面的代码:
BettingOnRed <- function(){
ball <- sample(1:37, 1, replace=TRUE)
if(ball <= 18) amount_won <- 1
else amount_won <- -1
c(amount_won, 1)
}
BettingOnNumber <- function() {
myNumber <- 17
ball <- sample(0:36, 1, replace=TRUE)
if(myNumber == ball) amount_won <- 35
else amount_won <- -1
c(amount_won, 1)
}
每个函数 returns 一个 length = 2
的向量,包含赢得的金额和下注的数量(在这两个函数中总是等于一个:这个值在另一个函数中起作用策略...)。
虽然看起来很简单,但如果我们计算预期赢利的百分比误差和每局赢的比例,我们就会部分地得到很大的误差。请参阅下面的table:
为了计算期望值,我设置了一个函数simulation()
,每个游戏重复 100,000 次并计算您在 table.
中找到的值
我不明白的是:为什么B的每场胜率误差这么大,而B的胜率误差这么小?
请在此处找到我们用于计算游戏 B 的精确值和百分比误差的公式:
- 令
EstWin
为每场比赛 B 的估计奖金。
- 令
EstProp
为 B 获胜的估计比例。
各自的确切值为:
- ExactWin = 1/37*35 - 36/37 = -1/37
- ExactProp = 1/37
百分比错误:
- PercErrorWin = (EstWin - ExactWin)/ExactWin
- PercErrorProp = (EstProp - ExactProp)/ExactProp
你如何解释这个错误?为什么B的错误不一样?我在这里错过了关于概率的重要事实吗?
在下面找到我函数的负责部分 'simulation':
(作为第一个参数,它采用上面两个函数中的一个)
simulation <- function(f, n = 100000){
result <- numeric(8)
winnings <- numeric(n)
games_won <- numeric(n)
for (i in 1:n){
fnct <- f()
winnings[i] <- fnct[1]
games_won[i] <- ifelse(fnct[1] > 0, 1, 0)
}
result[1] <- mean(winnings)
result[2] <- mean(games_won)
result
}
请注意,这不是全部功能,我只是删除了这个问题不需要的部分。
tl;dr 您的结果似乎是正确的;变化比你想象的要多(投注数字的变化 比红色投注的变化大 很多 ...)
你的模拟有很多方面可以简化,但我认为你的基本框架是正确的。实际上,您唯一缺少的是输出中预期的变化量;如果您对此进行检查,您会发现观察到的和预期之间的偏差确实不足为奇。 (你实际上可以通过分析来计算这个方差,但在这里我将通过蛮力来计算。)
模拟 100 次运行,每次运行 100,000 场比赛。我使用 plyr::raply()
是为了方便(它会自动组合您的结果并实现进度条),但您也可以使用 replicate()
或 for
循环来完成。
set.seed(101)
library(plyr)
rr <- raply(100,simulation(BettingOnNumber,100000),.progress="text")
绘制平均奖金的分布:蓝色=预期,红色=从您的单次模拟中观察到。
par(las=1,bty="l")
hist(rr[,1],col="gray",breaks=30,
xlab="mean amount won in 100,000 games",
ylab="Frequency (100 runs)")
exp_val <- -0.02703
obs_val <- -0.04852
abline(v=c(obs_val,exp_val),col=c("red","blue"),lwd=2)
这里计算一下这种偏差程度有多惊人:
mean(abs(rr[,1]-exp_val)>abs(obs_val-exp_val)) ## 0.21
这意味着您会在大约 21% 的时间内获得预期和观察到的偏差程度,或者更多的偏差(这实际上是结果的常客 p 值)。
使用“押红”策略尝试这个实验,您会发现方差小了多少...
我正在为 class 做一个项目:它是关于四种不同的法式轮盘赌(37 个数字)策略的统计评估。 前两个很简单:
- 一个。赌红一次
- 乙。投注第一时间
请找到下面的代码:
BettingOnRed <- function(){
ball <- sample(1:37, 1, replace=TRUE)
if(ball <= 18) amount_won <- 1
else amount_won <- -1
c(amount_won, 1)
}
BettingOnNumber <- function() {
myNumber <- 17
ball <- sample(0:36, 1, replace=TRUE)
if(myNumber == ball) amount_won <- 35
else amount_won <- -1
c(amount_won, 1)
}
每个函数 returns 一个 length = 2
的向量,包含赢得的金额和下注的数量(在这两个函数中总是等于一个:这个值在另一个函数中起作用策略...)。
虽然看起来很简单,但如果我们计算预期赢利的百分比误差和每局赢的比例,我们就会部分地得到很大的误差。请参阅下面的table:
为了计算期望值,我设置了一个函数simulation()
,每个游戏重复 100,000 次并计算您在 table.
我不明白的是:为什么B的每场胜率误差这么大,而B的胜率误差这么小?
请在此处找到我们用于计算游戏 B 的精确值和百分比误差的公式:
- 令
EstWin
为每场比赛 B 的估计奖金。 - 令
EstProp
为 B 获胜的估计比例。
各自的确切值为:
- ExactWin = 1/37*35 - 36/37 = -1/37
- ExactProp = 1/37
百分比错误:
- PercErrorWin = (EstWin - ExactWin)/ExactWin
- PercErrorProp = (EstProp - ExactProp)/ExactProp
你如何解释这个错误?为什么B的错误不一样?我在这里错过了关于概率的重要事实吗?
在下面找到我函数的负责部分 'simulation': (作为第一个参数,它采用上面两个函数中的一个)
simulation <- function(f, n = 100000){
result <- numeric(8)
winnings <- numeric(n)
games_won <- numeric(n)
for (i in 1:n){
fnct <- f()
winnings[i] <- fnct[1]
games_won[i] <- ifelse(fnct[1] > 0, 1, 0)
}
result[1] <- mean(winnings)
result[2] <- mean(games_won)
result
}
请注意,这不是全部功能,我只是删除了这个问题不需要的部分。
tl;dr 您的结果似乎是正确的;变化比你想象的要多(投注数字的变化 比红色投注的变化大 很多 ...)
你的模拟有很多方面可以简化,但我认为你的基本框架是正确的。实际上,您唯一缺少的是输出中预期的变化量;如果您对此进行检查,您会发现观察到的和预期之间的偏差确实不足为奇。 (你实际上可以通过分析来计算这个方差,但在这里我将通过蛮力来计算。)
模拟 100 次运行,每次运行 100,000 场比赛。我使用 plyr::raply()
是为了方便(它会自动组合您的结果并实现进度条),但您也可以使用 replicate()
或 for
循环来完成。
set.seed(101)
library(plyr)
rr <- raply(100,simulation(BettingOnNumber,100000),.progress="text")
绘制平均奖金的分布:蓝色=预期,红色=从您的单次模拟中观察到。
par(las=1,bty="l")
hist(rr[,1],col="gray",breaks=30,
xlab="mean amount won in 100,000 games",
ylab="Frequency (100 runs)")
exp_val <- -0.02703
obs_val <- -0.04852
abline(v=c(obs_val,exp_val),col=c("red","blue"),lwd=2)
这里计算一下这种偏差程度有多惊人:
mean(abs(rr[,1]-exp_val)>abs(obs_val-exp_val)) ## 0.21
这意味着您会在大约 21% 的时间内获得预期和观察到的偏差程度,或者更多的偏差(这实际上是结果的常客 p 值)。
使用“押红”策略尝试这个实验,您会发现方差小了多少...