随机数种子固定实验结果的一个坑

Posted 小哧

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了随机数种子固定实验结果的一个坑相关的知识,希望对你有一定的参考价值。

随机数种子固定实验结果的一个坑

用随机数种子来固定实验结果应该是一种可选的方案。

def seed_torch(seed=2022):
    random.seed(seed)
    os.environ['PYTHONHASHSEED'] = str(seed)  # 为了禁止hash随机化,使得实验可复现
    np.random.seed(seed)
    torch.manual_seed(seed)
    torch.cuda.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)  # if you are using multi-GPU.
    torch.backends.cudnn.benchmark = False
    torch.backends.cudnn.deterministic = True

我在使用nltk获取同义词的时候写的这玩意
synonyms = get_synonym_set(word, text_pos_tag[aug_idx][1])

然后我将这个set转化为list后random.choice来获取随机的一个同义词。

但是通过测试发现,我得到的list并不相同,这也导致了我实验结果的不一致,所以将这个list排个序就可以了。

我做了一个排查,问题不是出在set转化为list这一步,而是出在了得到的set中元素顺序并不一致,因为并不想知道nltk是怎么实现,所以我没有深入下去。

启发就是如果固定了随机数种子,实验结果仍然不一致的话,就要盯着从其他库拿到的东西是否也是固定的。

以上是关于随机数种子固定实验结果的一个坑的主要内容,如果未能解决你的问题,请参考以下文章

随机数种子固定实验结果的一个坑

参数变化:固定,但运行的种子不同

具有固定种子和可变精度的 boost::multiprecision 随机数

SVM sklearn 上的随机种子产生不同的结果

关于随机种子random.seed()测试 pytorch完全设置随机种子

如何用VB产生一个每次都不一样的随机数啊,用rnd的话只能产生一个固定的数字