在犰狳矩阵中具有概率的矢量化 Rcpp rbinom

Posted

技术标签:

【中文标题】在犰狳矩阵中具有概率的矢量化 Rcpp rbinom【英文标题】:Vectorized Rcpp rbinom with probabilities in Armadillo matrix 【发布时间】:2017-10-09 08:39:55 【问题描述】:

我有一个对称的概率矩阵,其中对角线条目为空。假设像

   0    0.5   0.1   0.6
   0.5   0    0.2   0.1
   0.1  0.2    0    0.2
   0.6  0.1   0.2    0

我想绘制一个虚拟矩阵,以便条目 [i,j] 的概率是概率矩阵中的条目 [i,j]。请注意,我拥有的概率矩阵是一个犰狳矩阵(一个大矩阵 5000x5000)。当然,对角线假人应该为空,因为它们的概率为空。我构建了两个函数来做到这一点,但它们并不快。我应该在循环中多次采样这个矩阵。

mat binom1(mat& prob)
  int n=prob.n_rows;
  mat sample(n,n,fill::zeros);
  NumericVector temp(2);

  for(int i(0);i<n-1;++i)
   for(int j(i+1);j<n;++j)
    temp=rbinom(2,1,prob(i,j));
    sample(i,j)=temp(0); sample(j,i)=temp(1);
   
  
 return sample;



mat binom2(mat& prob)
  int n=prob.n_rows;
  mat sample(n,n);

  for(int i(0);i<n;++i)
    for(int j(0);j<n;++j)
      sample(i,j)=as<double>(rbinom(1,1,prob(i,j)));
    
  
  return sample;

两者都比 R 中的矢量化 rbinom 慢。

   z=matrix(runif(1000^2),1000) #just an example for 1000x1000 matrix
   microbenchmark(rbinom(nrow(z)^2,1,z),binom1(z),binom2(z))

结果

               expr       min        lq        mean     median   uq      max
rbinom(nrow(z)^2, 1, z)  95.43756  95.94606  98.29283  97.5273 100.3040 108.2293
               binom1(z) 131.33937 133.25487 139.75683 136.4530 139.5511 229.0484
               binom2(z) 168.38226 172.60000 177.95935 175.6447 180.9531 277.3501

有没有办法让代码更快?

我看到了一个例子here。但就我而言,概率在犰狳矩阵中

【问题讨论】:

Vectorised Rcpp random binomial draws的可能重复 我尝试使用它,但在我的情况下,概率在犰狳矩阵中 【参考方案1】:

鉴于几乎重复的答案,您可以使用:

mat binom3(const mat& prob) 

  int n = prob.n_rows;
  mat sample(n, n);

  std::transform(prob.begin(), prob.end(), sample.begin(), 
                 [=](double p) return R::rbinom(1, p); );

  return sample;

微基准测试:

Unit: milliseconds
                    expr      min       lq      mean   median        uq       max neval
 rbinom(length(z), 1, z) 46.88264 47.28971  48.09543 47.66346  48.40734  65.29790   100
               binom1(z) 76.98416 82.60813  84.93669 83.51432  84.04780 126.46992   100
               binom2(z) 96.20707 98.59145 101.99215 99.56175 102.02750 153.04754   100
               binom3(z) 34.01417 34.49066  35.12199 34.93946  35.47979  38.22539   100

【讨论】:

【参考方案2】:

非常感谢。我也用过这个

   umat binom4(mat& prob)
     int n=prob.n_rows;
     mat temp(n,n,fill::randu);
     return (temp<prob);
   

我觉得快一点

microbenchmark(rbinom(nrow(z)^2,1,z),binom1(z),binom2(z),binom3(z),binom4(z))

               expr       min        lq        mean    median       uq     max       neval
rbinom(nrow(z)^2, 1, z)  94.24809  95.29728  97.24977  95.86829  98.19758 108.30877   100
              binom1(z) 130.20266 132.48951 138.07100 134.03693 137.34613 297.86393   100
              binom2(z) 164.96716 168.17024 175.89784 170.29310 173.93890 338.99306   100
              binom3(z)  64.57977  64.78340  67.03158  65.81533  67.42386  92.31300   100
              binom4(z)  29.66925  31.44107  32.81296  31.77392  33.31575  55.65539   100

【讨论】:

以上是关于在犰狳矩阵中具有概率的矢量化 Rcpp rbinom的主要内容,如果未能解决你的问题,请参考以下文章

犰狳矩阵列的非连续访问

(Rcpp, armadillo) 将 arma::vec 转换为 arma::mat

犰狳:将立方体子视图(管)转换为矢量

Rcpp犰狳中的样本

犰狳中的 Rcpp 糖命令

在rcpp犰狳中将向量与double进行比较