Haskell 键输入内存泄漏
Haskell key input memory leak
我针对 SO Haskell read raw keyboard input 中讨论的原始输入问题提出了以下代码。不幸的是,当我转到 ghci 运行 getAllInput
并按下右箭头键时,它永远不会 returns。除非我非常快地杀死它,否则它似乎会吃掉我所有的内存,以至于其他应用程序停止响应,我不得不重新启动 OS。在 Activity 监视器中,我可以看到 ghc 进程的内存迅速进入千兆字节。
(1) 我认为问题出在 go
的递归调用中,这是通过在 getChar
之前调用 hReady
来懒惰求值的;这意味着 hReady
不断返回 true 并且堆栈永远增长。这可信吗?
(2) 我习惯了这很快就会导致堆栈溢出异常的语言,所以它不会阻止我工作。有什么通用的方法可以防止这种大规模内存泄漏吗?也许启动 ghci 时对内存使用有硬性限制?
import System.IO
-- For example, should get "\ESC[C" from the user hitting the right arrow key.
getAllInput :: IO [Char]
getAllInput =
let
go :: IO [Char] -> IO [Char]
go chars = do
more <- hReady stdin
if more then go (added chars getChar) else chars
added :: IO [Char] -> IO Char -> IO [Char]
added chars char = do
chars1 <- chars
char1 <- char
return (chars1 ++ [char1])
in do
hSetBuffering stdin NoBuffering
firstChar <- getChar
go (return [firstChar])
我在 OS X 10.11.6 中 运行ning ghci 7.10.3。我以一些明显的方式清理了代码,基本上遵循 the similar SO answer:将 getChar
调用放在它自己的行中可以解决问题。但我想更好地理解这一点,以防它再次咬我。
您在 go
中有一个无限循环。如果 hReady
return 为真,那么您再次调用 go
,它会立即再次调用 hReady
,这当然会 return 为真,依此类推。由于 go (added chars getChar)
,您可能假设 added
将是 运行,但事实并非如此;它只是构建一个 IO
动作并将其作为参数传递给 go
,但该参数仅在 hReady
returns False
时使用。名称 chars
具有误导性——chars
实际上是一个 I/O 过程,当它最终成为 运行.[=28= 时,它将 return 一个字符列表]
通常,当使用 monad 时,"normal" 函数签名如下所示:
:: Foo -> Bar -> Baz -> IO Quuz
也就是说,monad (IO
) 只出现在 return 值上,而不是参数上。像
这样的签名
:: IO Foo -> IO Bar
通常表示正在进行高阶操作,例如,此函数可能会多次执行其参数或在新上下文中执行。
我推荐签名
go :: [Char] -> IO [Char]
added :: [Char] -> Char -> IO [Char]
并试图从那里编译程序。
您还应该尝试将 added
更改为纯函数
added :: [Char] -> Char -> [Char]
因为它实际上没有任何副作用。不过,实施和使用需要稍作改动。
总结讨论...
(1) 正如所解释的那样,内存泄漏是由一个无限循环引起的,在这个循环中惰性计算阻止了getChar
被调用。添加像 c <- getChar
这样的行会强制调用发生,这样 go (added chars c)
现在可以安全调用了。
(2) 以有限的堆大小启动 GHCi,如 ghci getchars.hs +RTS -M100m
中那样,将在内存泄漏耗尽所有内存之前中断内存泄漏。有关详细信息,请参阅 GHC Users Guide。
我针对 SO Haskell read raw keyboard input 中讨论的原始输入问题提出了以下代码。不幸的是,当我转到 ghci 运行 getAllInput
并按下右箭头键时,它永远不会 returns。除非我非常快地杀死它,否则它似乎会吃掉我所有的内存,以至于其他应用程序停止响应,我不得不重新启动 OS。在 Activity 监视器中,我可以看到 ghc 进程的内存迅速进入千兆字节。
(1) 我认为问题出在 go
的递归调用中,这是通过在 getChar
之前调用 hReady
来懒惰求值的;这意味着 hReady
不断返回 true 并且堆栈永远增长。这可信吗?
(2) 我习惯了这很快就会导致堆栈溢出异常的语言,所以它不会阻止我工作。有什么通用的方法可以防止这种大规模内存泄漏吗?也许启动 ghci 时对内存使用有硬性限制?
import System.IO
-- For example, should get "\ESC[C" from the user hitting the right arrow key.
getAllInput :: IO [Char]
getAllInput =
let
go :: IO [Char] -> IO [Char]
go chars = do
more <- hReady stdin
if more then go (added chars getChar) else chars
added :: IO [Char] -> IO Char -> IO [Char]
added chars char = do
chars1 <- chars
char1 <- char
return (chars1 ++ [char1])
in do
hSetBuffering stdin NoBuffering
firstChar <- getChar
go (return [firstChar])
我在 OS X 10.11.6 中 运行ning ghci 7.10.3。我以一些明显的方式清理了代码,基本上遵循 the similar SO answer:将 getChar
调用放在它自己的行中可以解决问题。但我想更好地理解这一点,以防它再次咬我。
您在 go
中有一个无限循环。如果 hReady
return 为真,那么您再次调用 go
,它会立即再次调用 hReady
,这当然会 return 为真,依此类推。由于 go (added chars getChar)
,您可能假设 added
将是 运行,但事实并非如此;它只是构建一个 IO
动作并将其作为参数传递给 go
,但该参数仅在 hReady
returns False
时使用。名称 chars
具有误导性——chars
实际上是一个 I/O 过程,当它最终成为 运行.[=28= 时,它将 return 一个字符列表]
通常,当使用 monad 时,"normal" 函数签名如下所示:
:: Foo -> Bar -> Baz -> IO Quuz
也就是说,monad (IO
) 只出现在 return 值上,而不是参数上。像
:: IO Foo -> IO Bar
通常表示正在进行高阶操作,例如,此函数可能会多次执行其参数或在新上下文中执行。
我推荐签名
go :: [Char] -> IO [Char]
added :: [Char] -> Char -> IO [Char]
并试图从那里编译程序。
您还应该尝试将 added
更改为纯函数
added :: [Char] -> Char -> [Char]
因为它实际上没有任何副作用。不过,实施和使用需要稍作改动。
总结讨论...
(1) 正如getChar
被调用。添加像 c <- getChar
这样的行会强制调用发生,这样 go (added chars c)
现在可以安全调用了。
(2) 以有限的堆大小启动 GHCi,如 ghci getchars.hs +RTS -M100m
中那样,将在内存泄漏耗尽所有内存之前中断内存泄漏。有关详细信息,请参阅 GHC Users Guide。