Haskell 键输入内存泄漏

Question

我针对 SO Haskell read raw keyboard input 中讨论的原始输入问题提出了以下代码。不幸的是，当我转到 ghci 运行 getAllInput 并按下右箭头键时，它永远不会 returns。除非我非常快地杀死它，否则它似乎会吃掉我所有的内存，以至于其他应用程序停止响应，我不得不重新启动 OS。在 Activity 监视器中，我可以看到 ghc 进程的内存迅速进入千兆字节。

(1) 我认为问题出在 go 的递归调用中，这是通过在 getChar 之前调用 hReady 来懒惰求值的；这意味着 hReady 不断返回 true 并且堆栈永远增长。这可信吗？

(2) 我习惯了这很快就会导致堆栈溢出异常的语言，所以它不会阻止我工作。有什么通用的方法可以防止这种大规模内存泄漏吗？也许启动 ghci 时对内存使用有硬性限制？

import System.IO

-- For example, should get "\ESC[C" from the user hitting the right arrow key.
getAllInput :: IO [Char]
getAllInput =
  let
    go :: IO [Char] -> IO [Char]
    go chars = do
      more <- hReady stdin
      if more then go (added chars getChar) else chars
    added :: IO [Char] -> IO Char -> IO [Char]
    added chars char = do
      chars1 <- chars
      char1 <- char
      return (chars1 ++ [char1])
  in do
    hSetBuffering stdin NoBuffering
    firstChar <- getChar
    go (return [firstChar])

我在 OS X 10.11.6 中运行ning ghci 7.10.3。我以一些明显的方式清理了代码，基本上遵循 the similar SO answer：将 getChar 调用放在它自己的行中可以解决问题。但我想更好地理解这一点，以防它再次咬我。

Answer 1

您在 go 中有一个无限循环。如果 hReady return 为真，那么您再次调用 go，它会立即再次调用 hReady，这当然会 return 为真，依此类推。由于 go (added chars getChar)，您可能假设 added 将是运行，但事实并非如此；它只是构建一个 IO 动作并将其作为参数传递给 go，但该参数仅在 hReady returns False 时使用。名称 chars 具有误导性——chars 实际上是一个 I/O 过程，当它最终成为运行.[=28= 时，它将 return 一个字符列表]

通常，当使用 monad 时，"normal" 函数签名如下所示：

:: Foo -> Bar -> Baz -> IO Quuz

也就是说，monad (IO) 只出现在 return 值上，而不是参数上。像

这样的签名

:: IO Foo -> IO Bar

通常表示正在进行高阶操作，例如，此函数可能会多次执行其参数或在新上下文中执行。

我推荐签名

go :: [Char] -> IO [Char]
added :: [Char] -> Char -> IO [Char]

并试图从那里编译程序。

您还应该尝试将 added 更改为纯函数

added :: [Char] -> Char -> [Char]

因为它实际上没有任何副作用。不过，实施和使用需要稍作改动。

Answer 2

总结讨论...

(1) 正如所解释的那样，内存泄漏是由一个无限循环引起的，在这个循环中惰性计算阻止了getChar被调用。添加像 c <- getChar 这样的行会强制调用发生，这样 go (added chars c) 现在可以安全调用了。

(2) 以有限的堆大小启动 GHCi，如 ghci getchars.hs +RTS -M100m 中那样，将在内存泄漏耗尽所有内存之前中断内存泄漏。有关详细信息，请参阅 GHC Users Guide。

Haskell 键输入内存泄漏

Haskell key input memory leak

haskell

memory-leaks

lazy-evaluation