在 Python 中生成随机文件名的最佳方法

Posted

技术标签:

【中文标题】在 Python 中生成随机文件名的最佳方法【英文标题】:Best way to generate random file names in Python 【发布时间】:2012-05-17 02:12:48 【问题描述】:

在 Python 中,生成一些随机文本以添加到我保存到服务器的文件(名称)之前的好方法或最佳方法是什么,以确保它不会被覆盖。谢谢!

【问题讨论】:

【参考方案1】:

您可以使用UUID module 来生成随机字符串:

import uuid
filename = str(uuid.uuid4())

这是一个有效的选择,因为 UUID 生成器极不可能产生重复的标识符(在这种情况下是文件名):

仅在接下来的 100 年每秒生成 10 亿个 UUID 之后,仅创建一个副本的概率约为 50%。如果地球上每个人都拥有 6 亿个 UUID,那么出现重复的概率约为 50%。

【讨论】:

这在您想要一个唯一的文件名但还不想创建它时也非常有用。 或者使用uuid.uuid4().hex 得到一个没有破折号的十六进制字符串(-)。【参考方案2】:

Python 具有生成临时文件名的功能,请参阅http://docs.python.org/library/tempfile.html。例如:

In [4]: import tempfile

tempfile.NamedTemporaryFile() 的每次调用都会生成一个不同的临时文件,并且可以使用.name 属性访问其名称,例如:

In [5]: tf = tempfile.NamedTemporaryFile()
In [6]: tf.name
Out[6]: 'c:\\blabla\\locals~1\\temp\\tmptecp3i'

In [7]: tf = tempfile.NamedTemporaryFile()
In [8]: tf.name
Out[8]: 'c:\\blabla\\locals~1\\temp\\tmpr8vvme'

一旦您有了唯一的文件名,就可以像使用任何常规文件一样使用它。 注意:默认情况下,该文件将被删除 关闭。但是,如果delete 参数为 False,则该文件不是 自动删除。

完整的参数集:

tempfile.NamedTemporaryFile([mode='w+b'[, bufsize=-1[, suffix=''[, prefix='tmp'[, dir=None[, delete=True]]]]]])

也可以为临时文件指定前缀(作为文件创建期间可以提供的各种参数之一):

In [9]: tf = tempfile.NamedTemporaryFile(prefix="zz")
In [10]: tf.name
Out[10]: 'c:\\blabla\\locals~1\\temp\\zzrc3pzk'

可以找到使用临时文件的其他示例here

【讨论】:

下次我重启机器时这些文件会被删除吗? 这个解决方案的问题是它不仅会生成一个文件名,还会生成一个已经打开的文件。如果您需要一个新的、尚不存在的文件的临时文件名(例如,用作 os 命令的输出),则不会这样做。在这种情况下,您可以执行类似 str(uuid.uuid4()) 的操作。 @Luca 感谢您的附加评论,这很有用,并注明以供将来参考。但是,OP 明确表示他/她想保存文件,因此需要打开它,所以这个解决方案提供了。 视情况而定。也许他需要该名称来构造适当的服务器调用。不确定。无论如何,您的回复肯定是更常见的情况。【参考方案3】:

一种常见的方法是在文件名中添加时间戳作为前缀/后缀,以与文件建立一些时间关系。如果您需要更多唯一性,您仍然可以在其中添加一个随机字符串。

import datetime
basename = "mylogfile"
suffix = datetime.datetime.now().strftime("%y%m%d_%H%M%S")
filename = "_".join([basename, suffix]) # e.g. 'mylogfile_120508_171442'

【讨论】:

在多线程环境中,序列1. Test if file exists, 2. create file. 中可能存在竞争条件如果另一个进程在步骤 1 和 2 之间中断您的进程并创建文件,则当您的代码恢复时它将覆盖另一个进程的文件。 @Li-aungYip 另外也可以使用6-8个random character sequence(万一同一秒生成2个文件)。 @bobobobo:或者你可以使用tempfile 模块,它会为你处理这个问题。 :) 我建议添加微秒,即...strftime("%y%m%d_%H%M%S%f")【参考方案4】:

如果您不需要文件路径,而只需要具有预定义长度的随机字符串,您可以使用类似的东西。

>>> import random
>>> import string

>>> file_name = ''.join(random.choice(string.ascii_lowercase) for i in range(16))
>>> file_name
'ytrvmyhkaxlfaugx'

【讨论】:

【参考方案5】:

OP 请求创建随机文件名而不是随机文件。时间和 UUID 可能会发生冲突。如果您在单台机器上工作(不是共享文件系统)并且您的进程/线程不会自行踩踏,请使用os.getpid() 获取您自己的 PID 并将其用作唯一文件名的元素。其他进程显然不会获得相同的 PID。如果您是多线程的,请获取线程 ID。如果您的代码有其他方面,其中单个线程或进程可以生成多个不同的临时文件,您可能需要使用另一种技术。滚动索引可以工作(如果您不将它们保留这么长时间或使用这么多文件,您会担心翻转)。在这种情况下,为“活动”文件保留全局哈希/索引就足够了。

很抱歉冗长的解释,但这确实取决于您的确切用法。

【讨论】:

【参考方案6】:

如果要将原始文件名保留为新文件名的一部分,可以使用当前时间的 MD5 哈希生成统一长度的唯一前缀:

from hashlib import md5
from time import localtime

def add_prefix(filename):
    prefix = md5(str(localtime()).encode('utf-8')).hexdigest()
    return f"prefix_filename"

对 add_prefix('style.css') 的调用会生成如下序列:

a38ff35794ae366e442a0606e67035ba_style.css
7a5f8289323b0ebfdbc7c840ad3cb67b_style.css

【讨论】:

为避免:Unicode 对象必须在散列之前进行编码,我改为 md5(str(localtime()).encode('utf-8')).hexdigest() 请注意,任何类型数据的哈希(包括时间戳)本身并不能确保唯一性(与随机选择的字节序列一样)。【参考方案7】:

在这里加上我的两分钱:

In [19]: tempfile.mkstemp('.png', 'bingo', '/tmp')[1]
Out[19]: '/tmp/bingoy6s3_k.png'

根据 tempfile.mkstemp 的 python 文档,它以最安全的方式创建一个临时文件。请注意,该文件将在此调用后存在:

In [20]: os.path.exists(tempfile.mkstemp('.png', 'bingo', '/tmp')[1])
Out[20]: True

【讨论】:

【参考方案8】:

由于日期和时间每秒钟都在变化,因此您需要将数据时间与 uuid(通用唯一标识符)连接起来 这是您答案的完整代码

   import uuid
   imageName = ':-%Y%m%d%H%M%S.jpeg'.format(str(uuid.uuid4().hex), datetime.now())

【讨论】:

虽然此代码可以解决问题,including an explanation 说明如何以及为什么解决问题将真正有助于提高您的帖子质量,并可能导致更多的赞成票。请记住,您正在为将来的读者回答问题,而不仅仅是现在提出问题的人。请edit您的回答添加解释并说明适用的限制和假设。【参考方案9】:

我个人更喜欢让我的文本不仅是随机的/唯一的,而且也很漂亮,这就是我喜欢 hashids 库的原因,它可以从整数生成漂亮的随机文本。 可以通过安装

pip install hashids

片段:

import hashids
hashids = hashids.Hashids(s, )
print hashids.encode(1, 2, 3)
>>> laHquq

简短说明:

Hashids 是一个小型开源库,可从数字生成短的、唯一的、非连续的 id。

【讨论】:

【参考方案10】:
>>> import random
>>> import string    
>>> alias = ''.join(random.choice(string.ascii_letters) for _ in range(16))
>>> alias
'WrVkPmjeSOgTmCRG'

您可以根据需要将“string.ascii_letters”更改为任何字符串格式以生成任何其他文本,例如手机号码、ID...

【讨论】:

【参考方案11】:
import random

def Generate(): #function generates a random 6 digit number
    code = ''
    for i in range(6):
        code += str(random.randint(0,9))
    return code

print(Generate()+".txt")

【讨论】:

【参考方案12】:

在其他一些情况下,如果您需要随机文件名是合理的,请使用faker 模块。这将产生具有通用扩展名的“合理”文件名。此方法可能会在一段时间后发生名称冲突。我认为在前面加上uuid 可能会更好。

pip install faker

那么,

from faker import Faker

fake = Faker()
for _ in range(10):
    print(fake.file_name())

链接到faker 文档:https://faker.readthedocs.io/en/master/index.html

【讨论】:

【参考方案13】:

你可以使用随机包:

import random
file = random.random()

【讨论】:

file = str(random.random()) 这是生成随机数,而不是随机文本。 谢谢。这个答案是一个很好的提交,但它有助于提供更完整的演示。

以上是关于在 Python 中生成随机文件名的最佳方法的主要内容,如果未能解决你的问题,请参考以下文章

在 Python 中生成随机数的标准方法是啥?

在javascript中生成随机颜色的最佳方法? [关闭]

python 在名为data.txt的文本文件中生成随机排序的数字和存储编号

在 Python 3 中生成具有随机长度的类随机唯一字符串的最快方法

如何在 Java 中生成随机排列?

如何在 Swift 中生成随机数?