如何获取序列中的下一个数字

Posted 2023-03-24

技术标签:

【中文标题】如何获取序列中的下一个数字【英文标题】：How to get the next number in a sequence 【发布时间】：2016-05-17 15:06:44 【问题描述】：

我有一张这样的桌子：

+----+-----------+------+-------+--+
| id | Part      | Seq  | Model |  |
+----+-----------+------+-------+--+
| 1  | Head      | 0    | 3     |  |
| 2  | Neck      | 1    | 3     |  |
| 3  | Shoulders | 2    | 29    |  |
| 4  | Shoulders | 2    | 3     |  |
| 5  | Stomach   | 5    | 3     |  |
+----+-----------+------+-------+--+

对于 Model 3，我如何在 Stomach 之后插入另一条记录，下面是新表的样子：

+----+-----------+------+-------+--+
| id | Part      | Seq  | Model |  |
+----+-----------+------+-------+--+
| 1  | Head      | 0    | 3     |  |
| 2  | Neck      | 1    | 3     |  |
| 3  | Shoulders | 2    | 29    |  |
| 4  | Shoulders | 2    | 3     |  |
| 5  | Stomach   | 5    | 3     |  |
| 6  | Groin     | 6    | 3     |  |
+----+-----------+------+-------+--+

有没有一种方法可以制作一个插入查询，它只会在 Model 3 的最高序列之后给出下一个数字。另外，寻找并发安全的东西。

【问题讨论】：

是否应该将 null Seq 视为 0？还是负 1 ？我将架构更改为不允许空值。因此，空值更改为 0 【参考方案1】：

如果您不维护计数器表，则有两种选择。在事务中，首先选择 MAX(seq_id) 并带有下表提示之一：

WITH(TABLOCKX, HOLDLOCK)

WITH(ROWLOCK, XLOCK, HOLDLOCK)

TABLOCKX + HOLDLOCK 有点矫枉过正。它会阻塞常规的 select 语句，即使事务很小，也可以认为是 heavy。

ROWLOCK, XLOCK, HOLDLOCK 表提示可能是一个更好的主意（但是：请阅读带有计数器表的替代方案）。优点是它不会阻塞常规的select 语句，即当select 语句没有出现在SERIALIZABLE 事务中，或者当select 语句不提供相同的表提示时。使用ROWLOCK, XLOCK, HOLDLOCK 仍然会阻塞插入语句。

当然，您需要确保在没有这些表提示的情况下（或在 SERIALIZABLE 事务之外），程序的其他部分不会选择 MAX(seq_id)，然后使用该值插入行。

请注意，根据以这种方式锁定的行数，SQL Server 可能会将锁定升级为表锁定。阅读更多关于锁升级的信息here。

使用WITH(ROWLOCK, XLOCK, HOLDLOCK) 的插入过程如下所示：

DECLARE @target_model INT=3;
DECLARE @part VARCHAR(128)='Spine';
BEGIN TRY
    BEGIN TRANSACTION;
    DECLARE @max_seq INT=(SELECT MAX(seq) FROM dbo.table_seq WITH(ROWLOCK,XLOCK,HOLDLOCK) WHERE model=@target_model);
    IF @max_seq IS NULL SET @max_seq=0;
    INSERT INTO dbo.table_seq(part,seq,model)VALUES(@part,@max_seq+1,@target_model);
    COMMIT TRANSACTION;
END TRY
BEGIN CATCH
    ROLLBACK TRANSACTION;
END CATCH

另一种可能更好的主意是有一个 counter 表，并在 counter 表上提供这些表提示。该表如下所示：

CREATE TABLE dbo.counter_seq(model INT PRIMARY KEY, seq_id INT);

然后您将按如下方式更改插入过程：

DECLARE @target_model INT=3;
DECLARE @part VARCHAR(128)='Spine';
BEGIN TRY
    BEGIN TRANSACTION;
    DECLARE @new_seq INT=(SELECT seq FROM dbo.counter_seq WITH(ROWLOCK,XLOCK,HOLDLOCK) WHERE model=@target_model);
    IF @new_seq IS NULL 
        BEGIN SET @new_seq=1; INSERT INTO dbo.counter_seq(model,seq)VALUES(@target_model,@new_seq); END
    ELSE
        BEGIN SET @new_seq+=1; UPDATE dbo.counter_seq SET seq=@new_seq WHERE model=@target_model; END
    INSERT INTO dbo.table_seq(part,seq,model)VALUES(@part,@new_seq,@target_model);
    COMMIT TRANSACTION;
END TRY
BEGIN CATCH
    ROLLBACK TRANSACTION;
END CATCH

优点是使用的行锁更少（即dbo.counter_seq 中每个模型一个），并且锁升级无法锁定整个dbo.table_seq 表从而阻塞了select 语句。

您可以通过在从counter_seq 选择序列后放置WAITFOR DELAY '00:01:00' 并在第二个 SSMS 选项卡中摆弄表格来测试所有这些并亲自查看效果。

PS1：使用ROW_NUMBER() OVER (PARTITION BY model ORDER BY ID) 不是一个好方法。如果删除/添加行，或者 ID 更改，则序列将更改（考虑发票 ID 永远不会更改）。同样在性能方面，在检索单行时必须确定所有先前行的行号是一个坏主意。

PS2：当 SQL Server 已经通过隔离级别或细粒度表提示提供锁定时，我永远不会使用外部资源来提供锁定。

【讨论】：

您认为这是一笔沉重的交易吗？ @Luke101 已修改答案以考虑交易的重要性。你好，我要实现这个解决方案，看看它是如何工作的。我会告诉你的。我喜欢（并且我使用）计数器表方法，但是您的实现有一点缺陷，当两个并发会话尝试获取不存在的下一个 seq 时，可能会发生主键冲突错误模型。可能失败的语句是INSERT INTO dbo.counter_seq(model,seq)VALUES(@target_model,@new_seq) @JesúsLópez 这根本不是真的。您可以从一个空的计数器表开始轻松地验证这一点（我刚刚做了），在检索计数器后使用此脚本两次，其中一个具有WAITFOR DELAY。启动一个等待，然后启动另一个。您将看到第二个将等待第一个完成，特别是在检索计数器时。两者都将成功完成，没有任何重复。【参考方案2】：

处理此类插入的正确方法是使用identity 列，或者，如果您愿意，可以使用列的序列和默认值。

但是，seq 列的 NULL 值似乎不正确。

查询的问题，例如：

Insert into yourtable(id, Part, Seq, Model)
    Select 6, 'Groin', max(Seq) + 1, 3 
    From yourtable;

是两个这样的查询，同时运行，可以产生相同的值。建议将seq 声明为唯一的标识列，让数据库完成所有工作。

【讨论】：

是的，一些序列号可以为空。此外，它们也都可以为空。有办法解决吗？如果这些值旨在枚举给定模型的记录，为什么要允许 NULL 值？我已将表更改为没有 NULL 值。现在我面临并发问题。这个解决方案并发安全吗？此外，增量必须仅适用于 Model 3。 @Luke101 。 . .当前的解决方案是使用identity 列或序列。是的，我在 id 字段上使用了一个身份。我必须只为Model: 3 而不是整个表增加Seq 字段。您的解决方案将为整个表找到最大值。另外，我在某处读到 max 对于并发不安全。这是真的吗？【参考方案3】：

让我们首先列出挑战：

这很好，我们会在第 3 步中解决的；->

我们需要并发操作的安全性（因此某种形式或混合的事务、隔离级别以及可能的“有点 SQL 互斥体”。）出于以下几个原因，直觉认为这里是一个存储过程：

2.1 更容易防止sql注入

2.2 我们可以更轻松地控制隔离级别（表锁定）并从这种需求带来的一些问题中恢复

2.3 我们可以使用应用级数据库锁来控制并发

所以，有了这个简短的前传，让我们尝试一个解决方案：

首先，我们正在创建您的原始表格，然后还创建一个表格来保存我们设置为最后使用的序列 + 1 的序列 (BodyPartsCounter)：

    CREATE TABLE BodyParts
        ([id] int identity, [Part] varchar(9), [Seq] varchar(4), [Model] int)
    ;

    INSERT INTO BodyParts
        ([Part], [Seq], [Model])
    VALUES
        ('Head', NULL, 3),
        ('Neck', '1', 3),
        ('Shoulders', '2', 29),
        ('Shoulders', '2', 3),
        ('Stomach', '5', 3)
    ;

    CREATE TABLE BodyPartsCounter
        ([id] int
        , [counter] int)
    ;

    INSERT INTO BodyPartsCounter
        ([id], [counter])
    SELECT 1, MAX(id) + 1 AS id FROM BodyParts
    ;

然后我们需要创建存储过程来发挥作用。简而言之，它充当互斥锁，基本上保证您的并发性（如果您不对其他地方的相同表进行插入或更新）。然后它获取下一个序列，更新它并插入新行。在这一切发生后，它将提交事务并释放存储的过程以供下一个等待调用线程。

SET ANSI_NULLS ON
GO
SET QUOTED_IDENTIFIER ON
GO
-- =============================================
-- Author:      Charlla
-- Create date: 2016-02-15
-- Description: Inserts a new row in a concurrently safe way
-- =============================================
CREATE PROCEDURE InsertNewBodyPart 
@bodypart varchar(50), 
@Model int = 3
AS
BEGIN
-- SET NOCOUNT ON added to prevent extra result sets from
-- interfering with SELECT statements.
SET NOCOUNT ON;

    BEGIN TRANSACTION;

    -- Get an application lock in your threaded calls
    -- Note: this is blocking for the duration of the transaction
    DECLARE @lockResult int;
    EXEC @lockResult = sp_getapplock @Resource = 'BodyPartMutex', 
                   @LockMode = 'Exclusive';
    IF @lockResult = -3 --deadlock victim
    BEGIN
        ROLLBACK TRANSACTION;
    END
    ELSE
    BEGIN
        DECLARE @newId int;
        --Get the next sequence and update - part of the transaction, so if the insert fails this will roll back
        SELECT @newId = [counter] FROM BodyPartsCounter WHERE [id] = 1;
        UPDATE BodyPartsCounter SET [counter] = @newId + 1 WHERE id = 1;

        -- INSERT THE NEW ROW
        INSERT INTO dbo.BodyParts(
            Part
            , Seq
            , Model
            )
            VALUES(
                @bodypart
                , @newId
                , @Model
            )
        -- END INSERT THE NEW ROW
        EXEC @lockResult = sp_releaseapplock @Resource = 'BodyPartMutex';
        COMMIT TRANSACTION;
    END;

END
GO

现在用这个运行测试：

EXEC    @return_value = [dbo].[InsertNewBodyPart]
    @bodypart = N'Stomach',
    @Model = 4

SELECT  'Return Value' = @return_value

SELECT * FROM BodyParts;
SELECT * FROM BodyPartsCounter

这一切都有效 - 但要小心 - 任何类型的多线程应用程序都需要考虑很多问题。

希望这会有所帮助！

【讨论】：

通过对 sp 稍作更改，您可以根据模型存储下一个序列，其中 id 字段可以映射到您的模型并存储该模型的下一个序列。只需在 select 和 update 语句中将 'where id = 1' 更改为 'where id = @model' 即可。此方法是否获取表锁？如果是这样，这可能有点慢。我一次在网站上有大约 100 个并发用户。我会说大约 2-3 个用户可能会尝试一次更新表格。 @Luke101 不会获得表锁。但是，它将在存储的过程（互斥锁）上获得“锁定”。但没有它，你几乎肯定会遇到死锁。完整的调用在 3 毫秒内执行，并且不会随着表的增长而增长，因为我们正在为序列使用单行表。如果您使用 MAX(Seq) 选项，随着表的增长，随着行数的增加，找到最大值需要更长的时间，您还将拥有必须在 seq 字段上维护的索引。没必要。我建议你计算一下你的交易量，看看这是否合适。这很棒。我已经实现了这个并且工作正常。我认为这是迄今为止最好的解决方案。我想再等几天再颁奖。谢谢 @Luke101 这里的缺点是有一个锁来获取所有模型的新序列ID。如果您有三个进程想要分别插入不同的模型，则它们都必须相互等待。这类似于排他表锁（在本例中位于计数器表上）。要修改这种工作方式以获得行级锁定，需要将模型 ID 嵌入到 @Resource 参数中。但是，如果您可以使用表提示在 SQL 语言中请求这种锁定，为什么还要为此烦恼呢？我严重怀疑海报是否在生产中使用它。【参考方案4】：

我相信处理这种序列生成场景的最佳选择是TT 建议的计数器表。我只是想在这里向您展示TT 实现的略微简化版本。

表格：

CREATE TABLE dbo.counter_seq(model INT PRIMARY KEY, seq INT);
CREATE TABLE dbo.table_seq(part varchar(128), seq int, model int);

更简单的版本（没有SELECT 语句来检索当前的seq）：

DECLARE @target_model INT=3;
DECLARE @part VARCHAR(128)='Otra MAS';

BEGIN TRY
    BEGIN TRANSACTION;
    DECLARE @seq int = 1
    UPDATE dbo.counter_seq WITH(ROWLOCK,HOLDLOCK) SET @seq = seq = seq + 1 WHERE model=@target_model;
    IF @@ROWCOUNT = 0 INSERT INTO dbo.counter_seq VALUES (@target_model, 1);
    INSERT INTO dbo.table_seq(part,seq,model)VALUES(@part,@seq,@target_model);
    COMMIT
END TRY
BEGIN CATCH
    ROLLBACK TRANSACTION;
END CATCH

【讨论】：

【参考方案5】：

由于您希望序列基于特定模型，因此只需在执行选择时将其添加到 where 子句中。这将确保 Max(SEQ) 仅适用于该模型系列。此外，由于 SEQ 可以为空，因此将其包装在 ISNULL 中，因此如果为空，它将为 0，因此 0 + 1 会将下一个设置为 1。这样做的基本方法是：

Insert into yourtable(id, Part, Seq, Model)
    Select 6, 'Groin', ISNULL(max(Seq),0) + 1, 3 
    From yourtable
    where MODEL = 3;

【讨论】：

【参考方案6】：

我首先不会尝试将Seq 值存储在表中。

正如您在 cmets 中所说，您的 ID 是 IDENTITY，它会由服务器以非常有效且并发安全的方式自动增加。使用它来确定插入行的顺序以及生成 Seq 值的顺序。

然后在查询中根据需要使用ROW_NUMBER 生成由Model 分区的Seq 值（对于Model 的每个值，序列从1 重新开始）。

SELECT
    ID
    ,Part
    ,Model
    ,ROW_NUMBER() OVER(PARTITION BY Model ORDER BY ID) AS Seq
FROM YourTable

【讨论】：

在某些情况下，用户可以更改记录的顺序。好的。有效点。在这种情况下，您必须存储Seq。但是，您真的需要为每个Model 设置单独的序列吗？我会将Seq 默认设置为ID（插入行时），然后允许用户交换两个Seq 值以调整两行的顺序。【参考方案7】：

insert into tableA (id,part,seq,model)
values
(6,'Groin',(select MAX(seq)+1 from tableA where model=3),3)

【讨论】：

【参考方案8】：

create function dbo.fncalnxt(@model int)
returns int 
begin
declare @seq int
select @seq= case when @model=3 then max(id) --else
end from tblBodyParts
return @seq+1
end
--query idea To insert values, ideal if using SP to insert
insert into tblBodyParts values('groin',dbo.fncalnxt(@model),@model)

我猜你可以试试这个。新手拍的，如有错误请指正。我建议使用函数根据模型获取 seq 列中的值；你必须检查 else 情况，但要返回你想要的另一个值，当 model!=3 时，它现在会返回 null。

【讨论】：

【参考方案9】：

假设你有下表：

CREATE TABLE tab (
    id int IDENTITY(1,1) PRIMARY KEY,
    Part VARCHAR(32) not null,
    Seq int not null,
    Model int not null
);

INSERT INTO
    tab(Part,Seq,Model)
VALUES
    ('Head', 0, 3),
    ('Neck', 1, 3),
    ('Shoulders', 2, 29),
    ('Shoulders', 2, 3),
    ('Stomach', 5, 3);

下面的查询将允许您导入多条记录，而不会破坏模型序列

INSERT INTO
    tab (model, part, model_seq)
SELECT
    n.model,
    n.part,
    -- ensure new records will get receive the proper model_seq
    IFNULL(max_seq + model_seq, model_seq) AS model_seq
FROM
    (
        SELECT
            -- row number for each model new record
            ROW_NUMBER() OVER(PARTITION BY model ORDER BY part) AS model_seq,
            n.model,
            n.part,
            MAX(t.seq) AS max_seq
        FROM
            -- Table-values constructor allows you to prepare the
            -- temporary data (with multi rows),
            -- where you could join the existing one
            -- to retrieve the max(model_seq) if any
            (VALUES
                ('Stomach',3),
                ('Legs',3),
                ('Legs',29),
                ('Arms',1)
            ) AS n(part, model)
        LEFT JOIN
            tab
        ON
            tab.model = n.model
        GROUP BY
            n.model n.part
    ) AS t

我们需要 row_number() 来确保如果我们导入多个值，订单将被保留。更多关于ROW_NUMBER() OVER() (Transact-SQL)的信息

表值构造函数用于创建具有新值的表并加入模型的MAX model_seq。您可以在此处找到有关表值构造函数的更多信息：Table Value Constructor (Transact-SQL)

【讨论】：

以上是关于如何获取序列中的下一个数字的主要内容，如果未能解决你的问题，请参考以下文章