固定长度的唯一ID创建
Posted
技术标签:
【中文标题】固定长度的唯一ID创建【英文标题】:Unique Id creation of a fixed length 【发布时间】:2011-12-27 06:51:41 【问题描述】:嗯,我一直在寻找在 java 代码中生成 UID 的方法(其中大多数也进入了 ***)。最好是使用 java 的 UUID 来创建唯一的 id,因为它使用时间戳。但我的问题是它是 128 位长,我需要一个较短的字符串,比如 14 或 15 个字符。因此,我设计了以下代码。
Date date = new Date();
Long luid = (Long) date.getTime();
String suid = luid.toString();
System.out.println(suid+": "+suid.length() + " characters");
Random rn = new Random();
Integer long1 = rn.nextInt(9);
Integer long2 = rn.nextInt(13);
String newstr = suid.substring(0, long2) + " " + long1 + " " + suid.subtring(long2);
System.out.println("New string in spaced format: "+newstr);
System.out.println("New string in proper format: "+newstr.replaceAll(" ", ""));
请注意,我只是显示间隔格式和格式正确的字符串,仅用于与原始字符串进行比较。
这能保证每次都有 100% 的唯一 ID 吗?或者你认为这些数字有可能重复吗?此外,我可以在开始或结束时将随机数插入“可能”创建重复数字的随机位置,而不是插入。这是为了完成我的 UID 所需的长度。尽管如果您需要少于 13 个字符的 UID,这可能不起作用。
有什么想法吗?
【问题讨论】:
当然不能保证任何 ID 是唯一的——毕竟,ID 集是有限的,您可以查看任意次数。 (当然,这对 128 但 UUID 也有效。) 而且,你的ID越小,碰撞的概率就越大。所以基本上你应该选择更长的ID,如果你希望你的概率很低。 但时间戳始终是唯一的,除非您在几分之一秒内发出两个请求,这不太可能。这与随机一起应该会增加始终唯一的可能性。 您可能会感到惊讶,但时间戳也不是唯一的。 :) 您的时间戳类型有多大? 16位?在任何 2^16 + 1 个时间戳值中,至少会有两个相等的值。 好吧。我的不是确切意义上的“时间戳”。 Date.getTime() 是毫秒数。这个不会在一个上限之后重复,不是吗? (可能是一个愚蠢的问题:P) 【参考方案1】:如果这是一个分布式系统,这当然行不通,但是像下面这样的东西怎么样。
private AtomicLong uniqueId = new AtomicLong(0);
...
// get a unique current-time-millis value
long now;
long prev;
do
prev = uniqueId.get();
now = System.currentTimeMillis();
// make sure now is moving ahead and unique
if (now <= prev)
now = prev + 1;
// loop if someone else has updated the id
while (!uniqueId.compareAndSet(prev, now));
// shuffle it
long result = shuffleBits(now);
System.out.println("Result is " + Long.toHexString(result));
public static long shuffleBits(long val)
long result = 0;
result |= (val & 0xFF00000000000000L) >> 56;
result |= (val & 0x00FF000000000000L) >> 40;
result |= (val & 0x0000FF0000000000L) >> 24;
result |= (val & 0x000000FF00000000L) >> 8;
result |= (val & 0x00000000FF000000L) << 8;
result |= (val & 0x0000000000FF0000L) << 24;
result |= (val & 0x000000000000FF00L) << 40;
result |= (val & 0x00000000000000FFL) << 56;
return result;
可以改进位混洗以在每次迭代中产生更多的值变化。您提到您不希望数字是连续的,但您没有指定完全随机性的要求。
当然不如UUID
,但比数据库操作快。
【讨论】:
【参考方案2】:最简单的方法是使用可用的数据库序列。如果不是,你可以模拟如下:
创建一个表,其中有一列将保存最大值 到目前为止使用(最初为 0)。一些应用程序创建多行 其中每一行控制一个特定的唯一 ID,但你真的 需要的是一排。对于此示例,假设表结构为 如下:
ID_TABLE
ID_NAME VARCHAR(40); -- Or whatever type is appropriate
ID_COLUMN INTEGER; -- Or whatever type is appropriate
每个进程通过执行以下操作来保留行:
a. Begin Txn;
b. Update ID_TABLE set ID_VALUE = ID_VALUE + <n> where ID_NAME = <name>;
c. Select ID_VALUE from ID_TABLE where ID_NAME = <name>;
d. Commit Txn;
如果这一切都成功完成,那么您刚刚保留了 范围 (val - n + 1) 到 val,其中 val 是步骤 c 的返回值。以上。
每个进程从它保留的范围内分发 ID。如果 进程是多线程的,它必须提供同步以确保 每个值最多分发一次。当它耗尽它的供应时 的值它回到第 2 步并保留更多的值。笔记 并非所有保留的值都可以保证使用。如果 一个进程在不使用它拥有的所有值的情况下终止 保留,未使用的值将丢失并且永远不会使用。
【讨论】:
是的,这很好。但事情是所有的 id 现在都显得非常连续,我忘了提到我不想要的。我想让它乍一看有点随机,时间戳看起来像。感谢您的帮助。 如果您的问题尽可能准确,它将帮助您获得好的答案。以上是关于固定长度的唯一ID创建的主要内容,如果未能解决你的问题,请参考以下文章
python 中md5 和 sha1 加密, md5 + os.urandom 生成全局唯一ID