拒绝采样 Rejection Sampling

Posted timhy

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了拒绝采样 Rejection Sampling相关的知识,希望对你有一定的参考价值。

2018-12-09 16:40:30

一、使用Rand7()来生成Rand10()

问题描述:

技术分享图片

问题求解:

这个问题字节跳动算法岗面试有问到类似的,有rand6,求rand8,我想了好久,最后给了一个特殊解法,就进行三次,每次取前三个数和后三个数的概率相等为1 / 2,那么最后需要得到的概率是1 / 8,就可以通过取三次得到。问题就转变成了映射的问题,当然映射的方式是很简单的,类似二进制的方法,很容易就可以进行映射。

但是,上述的解法在本题中是没有办法使用的,就需要更通用的解法,说实话,之前也没有做过Rejection Sampling标签下的题目,这个问题的通用解法就是使用拒绝采样的算法来进行解决。

首先我们肯定是需要对原空间进行扩充的,因为原空间的大小比生成空间的大小要小。

我其实最初想到的也是两次求rand7(),然后直接求和,但是很显然的这样得到的解空间中的1 - 10是不平均分配的,即使通过对10取余 + 1也不能得到等概率的解。

当然还有人可能会想通过求乘积的方式来扩充空间,可惜的是这样也是非等概率的,具体可以见下图:

技术分享图片

技术分享图片

那么怎么样才能得到等概率的呢?其实,我们只需要对两次取得的各个可能的数进行编号,每个编号不就是等可能的么?

技术分享图片

由于编号的总长度大于10的倍数,后面的49 - 40 = 9个数字就需要抛弃掉。通过这种方式,我们就可以等概率的生成1 - 10这10个整数。

/**
 * The rand7() API is already defined in the parent class SolBase.
 * public int rand7();
 * @return a random integer in the range 1 to 7
 */
class Solution extends SolBase {
    public int rand10() {
        int res = Integer.MAX_VALUE;
        while (res >= 40) {
            res = 7 * (rand7() - 1) + rand7() - 1;
        }
        return res % 10 + 1;
    }
}

 

二、Generate Random Point in a Circle

问题描述:

技术分享图片

问题求解:

本题最直观的解法就是拒绝采样了,解法的流程是生成一个圆的外接矩形框,随机产生矩形框中的数字,如果在圆内,那么就输出,否则拒绝采样,重新生成一遍。

本题中有个问题就是题目描述中说边界的点是算在圆中的,但是Java中的随机数如Math.random(),或者Random rand.nextDouble()产生的随机数都在[0, 1.0)前开后闭,这也就意味着某些圆上的点是没有办法取到的。

这个问题呢,可以这么理解,纵然有某些圆上的点是没有办法取到的,但是并不影响最终的结果,因为圆中的点理论上来说是有无数个的,因此对于某个单独的点其生成的概率是为0 的。

class Solution {
    double r, x, y;
        
    public Solution(double radius, double x_center, double y_center) {
        r = radius;
        x = x_center;
        y = y_center;
    }
    
    public double[] randPoint() {
        Random rand = new Random();
        Double nx = x - r + rand.nextDouble() * 2 * r;
        double ny = y - r + rand.nextDouble() * 2 * r;
        double r2 = r * r;
        while(dis(nx, ny) >= r2){
            nx = x - r + rand.nextDouble() * 2 * r;
            ny = y - r + rand.nextDouble() * 2 * r;
        }
        return new double[]{nx, ny};
    }
    
    // it returns the square of the distance between the point and the center;
    double dis(double nx, double ny){
        return (nx - x) * (nx - x) + (ny - y) * (ny - y);
    }
}

 

以上是关于拒绝采样 Rejection Sampling的主要内容,如果未能解决你的问题,请参考以下文章

470. Implement Rand10() Using Rand7() (拒绝采样Reject Sampling)

图像的上采样(up-sampling)和下采样(down-sampling)

基于Softmax与Sampling的方法,流式采样率预估

漫谈“采样”(sampling)

基于Softmax与Sampling的方法,流式采样率预估

基于Softmax与Sampling的方法,流式采样率预估