Haskell 键输入内存泄漏

Haskell key input memory leak

我针对 SO Haskell read raw keyboard input 中讨论的原始输入问题提出了以下代码。不幸的是,当我转到 ghci 运行 getAllInput 并按下右箭头键时,它永远不会 returns。除非我非常快地杀死它,否则它似乎会吃掉我所有的内存,以至于其他应用程序停止响应,我不得不重新启动 OS。在 Activity 监视器中,我可以看到 ghc 进程的内存迅速进入千兆字节。

(1) 我认为问题出在 go 的递归调用中,这是通过在 getChar 之前调用 hReady 来懒惰求值的;这意味着 hReady 不断返回 true 并且堆栈永远增长。这可信吗?

(2) 我习惯了这很快就会导致堆栈溢出异常的语言,所以它不会阻止我工作。有什么通用的方法可以防止这种大规模内存泄漏吗?也许启动 ghci 时对内存使用有硬性限制?

import System.IO

-- For example, should get "\ESC[C" from the user hitting the right arrow key.
getAllInput :: IO [Char]
getAllInput =
  let
    go :: IO [Char] -> IO [Char]
    go chars = do
      more <- hReady stdin
      if more then go (added chars getChar) else chars
    added :: IO [Char] -> IO Char -> IO [Char]
    added chars char = do
      chars1 <- chars
      char1 <- char
      return (chars1 ++ [char1])
  in do
    hSetBuffering stdin NoBuffering
    firstChar <- getChar
    go (return [firstChar])

我在 OS X 10.11.6 中 运行ning ghci 7.10.3。我以一些明显的方式清理了代码,基本上遵循 the similar SO answer:将 getChar 调用放在它自己的行中可以解决问题。但我想更好地理解这一点,以防它再次咬我。

您在 go 中有一个无限循环。如果 hReady return 为真,那么您再次调用 go,它会立即再次调用 hReady,这当然会 return 为真,依此类推。由于 go (added chars getChar),您可能假设 added 将是 运行,但事实并非如此;它只是构建一个 IO 动作并将其作为参数传递给 go,但该参数仅在 hReady returns False 时使用。名称 chars 具有误导性——chars 实际上是一个 I/O 过程,当它最终成为 运行.[=28= 时,它将 return 一个字符列表]

通常,当使用 monad 时,"normal" 函数签名如下所示:

:: Foo -> Bar -> Baz -> IO Quuz

也就是说,monad (IO) 只出现在 return 值上,而不是参数上。像

这样的签名
:: IO Foo -> IO Bar

通常表示正在进行高阶操作,例如,此函数可能会多次执行其参数或在新上下文中执行。

我推荐签名

go :: [Char] -> IO [Char]
added :: [Char] -> Char -> IO [Char]

并试图从那里编译程序。

您还应该尝试将 added 更改为纯函数

added :: [Char] -> Char -> [Char]

因为它实际上没有任何副作用。不过,实施和使用需要稍作改动。

总结讨论...

(1) 正如所解释的那样,内存泄漏是由一个无限循环引起的,在这个循环中惰性计算阻止了getChar被调用。添加像 c <- getChar 这样的行会强制调用发生,这样 go (added chars c) 现在可以安全调用了。

(2) 以有限的堆大小启动 GHCi,如 ghci getchars.hs +RTS -M100m 中那样,将在内存泄漏耗尽所有内存之前中断内存泄漏。有关详细信息,请参阅 GHC Users Guide