GHC 分析文件和图表是矛盾的

Posted

技术标签:

【中文标题】GHC 分析文件和图表是矛盾的【英文标题】:GHC profiling file and chart are contradictory 【发布时间】:2016-07-11 01:49:52 【问题描述】:

我有一个用 ST.Strict 编写的 Eratosthenes 程序筛子,当我看到它占用大量内存时,我正在对其进行分析:

Sun Jul 10 18:27 2016 Time and Allocation Profiling Report  (Final)

   Primes +RTS -hc -p -K1000M -RTS 10000000

total time  =        2.32 secs   (2317 ticks @ 1000 us, 1 processor)
total alloc = 5,128,702,952 bytes  (excludes profiling overheads)

(其中 10^7)是我要求它生成的素数数量。

奇怪的是,分析图显示了完全不同的东西:

我是否误读了其中一张图中的内容?还是其中一种工具有问题?

供参考,我的代码是

-# LANGUAGE BangPatterns #-

import Prelude hiding (replicate, read)
import qualified Text.Read as T
import Data.Vector.Unboxed.Mutable(replicate, write, read)
import Control.Monad.ST.Strict
import Data.STRef
import Control.Monad.Primitive

import Control.Monad

import System.Environment

main = print . length . primesUpTo . T.read . head =<< getArgs

primesUpTo :: Int -> [Int]
primesUpTo n = runST $ do
        primes <- replicate n True
        write primes 0 False
        write primes 1 False
        sieve 2 primes
        return []
        -- Removed to avoid the memory allocation of creating the list for profiling purposes
        -- filterM (read primes) [0..n-1]

    where
    sieve !i primes | i * i >= n    = return primes
    sieve !i primes = do
        v <- read primes i
        counter <- newSTRef $ i * i
        when v $ whileM_ ((< n) <$!> readSTRef counter) $ do
            curr_count <- readSTRef counter
            write primes curr_count False
            writeSTRef counter (curr_count + i)
        sieve (i + 1) primes

whileM_ :: (Monad m) => m Bool -> m a -> m ()
whileM_ condition body = do
    cond <- condition
    when cond $ do
        body
        whileM_ condition body

【问题讨论】:

【参考方案1】:

这似乎让很多人感到困惑。

total alloc = 5,128,702,952 bytes  (excludes profiling overheads)

这实际上是您的程序执行的所有分配的总大小,包括在分配后几乎立即失效的“临时”对象。分配本身几乎是免费的,通常 Haskell 程序以大约 1-2 GB/s 的速率分配。

奇怪的是,分析图显示了完全不同的东西:

确实,分析图显示了在任何特定时间在堆上的所有对象的总大小。这反映了程序的空间使用情况。如果您的程序在恒定空间中运行,则此图中显示的数字将保持恒定。

【讨论】:

以上是关于GHC 分析文件和图表是矛盾的的主要内容,如果未能解决你的问题,请参考以下文章

TRIZ发明问题解决理论——本质是分析问题中的矛盾,利用资源(时间空间物质能量功能信息等)来解决矛盾从而解决问题——抽象出来:问题是什么,为什么?

[思]生活是否是遇到问题-分析问题-解决问题

lasso和cox结果矛盾

需求建模和表述的技术

当和别人产生不好解决的矛盾时,应该怎么办?

关于requirejs和grunt压缩合并是否矛盾