Redigo:当 Redis 服务器关闭时快速失败
Redigo: Fail fast when redis server is down
当我连接的 redis 服务器出现故障时,我正在努力让 go 快速失败,希望有一个可靠的解决方案。
我正在使用 redigo 并且正在设置连接池,如下所示:
// This has other stuff in it in the code, use it as a
// central repository for things we want in memory
type State struct{
redisPool *redis.Pool
}
func (state *State) GetRedisConn() redis.Conn {
return state.redisPool.Get()
}
func main() {
state.redisPool = &redis.Pool{
MaxIdle: 200,
MaxActive: 9000,
IdleTimeout: time.Minute,
Dial: func() (redis.Conn, error) {
return redis.Dial("tcp", *redisAddress,
redis.DialConnectTimeout(1*time.Second),
redis.DialReadTimeout(100*time.Millisecond),
redis.DialWriteTimeout(100*time.Millisecond),
)
},
}
}
并请求新连接并像这样使用它们:
t0 := time.Now()
conn := state.GetRedisConn()
if conn != nil && conn.Err() == nil {
defer conn.Close()
// Do stuff
else {
log.Printf("no redis probably")
}
log.Println(time.Now().Sub(t0).Seconds())
当 redis 启动时,这很好用,事情发生在几毫秒内。当我使用 redis 时,我的第 75 个百分位上升到 7+ 秒,我的第 99 个百分位上升到 10 秒(我可以在普罗米修斯上看到这个)
我做错了什么?为什么这不会更快超时?
我的印象是 redis.DialConnectTimeout(1*time.Second)
会将问题限制在 1 秒,但事实并非如此。
编辑:事实证明这是由于我在普罗米修斯中犯了一个错误,将桶设置得太大,所以当 redis 在一秒钟后超时时,我的桶已经设置了 1s 桶并且一个 10 秒的存储桶,所以我的请求(刚好超过 1 秒)最终进入了 10 秒的存储桶,从而扭曲了结果。我相信这个讨论在某些时候会对某人有用。
失败后限速拨号次数:
func main() {
var (
nextDial time.Time
mu sync.Mutex
)
state.redisPool = &redis.Pool{
MaxIdle: 200,
MaxActive: 9000,
IdleTimeout: time.Minute,
Dial: func() (redis.Conn, error) {
mu.Lock() // Dial can be called concurrently
defer mu.Unlock()
if time.Now().Before(nextDial) {
return nil, errors.New("waiting for dial")
}
c, err := redis.Dial("tcp", *redisAddress,
redis.DialConnectTimeout(1*time.Second),
redis.DialReadTimeout(100*time.Millisecond),
redis.DialWriteTimeout(100*time.Millisecond),
)
if err == nil {
nextDial = time.Time{}
} else {
nextDial = time.Now().Add(time.Second) // don't attempt dial for one second
}
return c, err
},
}
}
当我连接的 redis 服务器出现故障时,我正在努力让 go 快速失败,希望有一个可靠的解决方案。
我正在使用 redigo 并且正在设置连接池,如下所示:
// This has other stuff in it in the code, use it as a
// central repository for things we want in memory
type State struct{
redisPool *redis.Pool
}
func (state *State) GetRedisConn() redis.Conn {
return state.redisPool.Get()
}
func main() {
state.redisPool = &redis.Pool{
MaxIdle: 200,
MaxActive: 9000,
IdleTimeout: time.Minute,
Dial: func() (redis.Conn, error) {
return redis.Dial("tcp", *redisAddress,
redis.DialConnectTimeout(1*time.Second),
redis.DialReadTimeout(100*time.Millisecond),
redis.DialWriteTimeout(100*time.Millisecond),
)
},
}
}
并请求新连接并像这样使用它们:
t0 := time.Now()
conn := state.GetRedisConn()
if conn != nil && conn.Err() == nil {
defer conn.Close()
// Do stuff
else {
log.Printf("no redis probably")
}
log.Println(time.Now().Sub(t0).Seconds())
当 redis 启动时,这很好用,事情发生在几毫秒内。当我使用 redis 时,我的第 75 个百分位上升到 7+ 秒,我的第 99 个百分位上升到 10 秒(我可以在普罗米修斯上看到这个)
我做错了什么?为什么这不会更快超时?
我的印象是 redis.DialConnectTimeout(1*time.Second)
会将问题限制在 1 秒,但事实并非如此。
编辑:事实证明这是由于我在普罗米修斯中犯了一个错误,将桶设置得太大,所以当 redis 在一秒钟后超时时,我的桶已经设置了 1s 桶并且一个 10 秒的存储桶,所以我的请求(刚好超过 1 秒)最终进入了 10 秒的存储桶,从而扭曲了结果。我相信这个讨论在某些时候会对某人有用。
失败后限速拨号次数:
func main() {
var (
nextDial time.Time
mu sync.Mutex
)
state.redisPool = &redis.Pool{
MaxIdle: 200,
MaxActive: 9000,
IdleTimeout: time.Minute,
Dial: func() (redis.Conn, error) {
mu.Lock() // Dial can be called concurrently
defer mu.Unlock()
if time.Now().Before(nextDial) {
return nil, errors.New("waiting for dial")
}
c, err := redis.Dial("tcp", *redisAddress,
redis.DialConnectTimeout(1*time.Second),
redis.DialReadTimeout(100*time.Millisecond),
redis.DialWriteTimeout(100*time.Millisecond),
)
if err == nil {
nextDial = time.Time{}
} else {
nextDial = time.Now().Add(time.Second) // don't attempt dial for one second
}
return c, err
},
}
}