SQL 数据库存储不同类型的值(在单个字段中或模拟为单个字段)

Posted

技术标签:

【中文标题】SQL 数据库存储不同类型的值(在单个字段中或模拟为单个字段)【英文标题】:SQL Database storing different types of values (in or simulated as a single field) 【发布时间】:2011-08-14 15:48:32 【问题描述】:

在数据库中,我希望能够将不同类型的值分配给变量表中的变量。那么我是否需要为每种值类型创建一个单独的值表?如果是这样,我不确定您如何将 Values 实际链接到正确的表并因此链接到正确的值。我怎样才能达到我所追求的目标?

Variables
    ID
    Name

VariableValuesLink
    ID
    IDVars
    IDVals

Values
    IDvals

ValuesValueLink
    ID
    IDvals
    IDval

ValuesInt
    IDval
    IntVal

ValuesFloat
    IDval
    FloatVal

ValuesDouble
    IDval
    DoubleVal

etc...
etc...
etc...
etc...

我的目标是得到这样的东西:

Variable: 
    ezas123
Values:
    1 (Int)
    2.0 (Float)
    3.0 (Double)

Variable:
    QuickFox
Values:
    The (TinyText)
    Quick (TinyText)
    Brown (TinyText)
    Fox (TinyText)
    Jumped (TinyText)
    Over (TinyText)
    The (TinyText)
    Lazy (TinyText)
    Dog (TinyText)

Variable:
    Pangrams
Values:
    The Quick Brown Fox Jumped Over The Lazy Dog (Text)
    How quickly daft jumping zebras vex (Text)

因此,当我查询数据库时,我将能够取回这组结果(其中值的类型不同)

Variable    Value
ezas123     1
ezas123     2.0
ezas123     3.0
QuickFox    The
QuickFox    Quick
QuickFox    Brown
QuickFox    Fox
QuickFox    Jumped
QuickFox    Over
QuickFox    The
QuickFox    Lazy
QuickFox    Dog
Pangrams    The Quick Brown Fox Jumped Over The Lazy Dog
Pangrams    How quickly daft jumping zebras vex

【问题讨论】:

我想如果最坏的情况变得更糟,我可以简单地将值声明为数据类型 VARCHAR(255) 并有另一列来声明变量的类型,所以当我稍后处理它时我可以转换它任何需要的东西。 我也是这样做的。他们都有自己的优势——我认为 varchar(max) 或 nvarchar(max) 大多数时候可能更容易。如果您有很多用户输入,它可能会变得很麻烦——因为在您在字典中有数据之后会出现数据类型转换问题(作为您输入之前的操作)。 您使用的是哪个 DBMS? 【参考方案1】:

您可以通过这种方式简化您的设计——只需让每个值表指向变量表即可。不需要链接表。我能想到的链接表的唯一原因是,如果您想要一种“更简单”的方式来对所有变量类型进行排序。如果不需要,请使用以下设计:

Variable
    ID
    Name

ValuesInt
    IDvariable
    IntVal

ValuesFloat
    IDvariable
    FloatVal

ValuesDouble
    IDvariable
    DoubleVal

etc...
etc...
etc...

你的 sql 是如何简单的:

select v.name as Variable,
       coalesce(cast(vi.IntVal as varchar(max)),
                cast(vf.FoatVal as varchar(max)),
                cast(vd.DoubleVal as varchar(max)),
                '') as Value
From Variable V
JOIN ValuesInt vi on V.ID = vi.IDvariable
JOIN ValuesFloat vf on V.ID = vf.IDvariable
JOIN ValuesDouble vd on V.ID = vd.IDvariable

【讨论】:

【参考方案2】:

几点:

在您的示例中,变量 ezas123 具有三个具有不同数据类型的值,这意味着变量本身实际上没有定义的数据类型。这可能会导致下游出现问题,并且可能表明数据的定义很差。我会考虑包括一个限制,即给定变量的所有值必须具有相同的数据类型。

1234563您不能在同一输出列中具有不同数据类型的值)。考虑到这一点,您真的需要不同的数据类型,还是 varchar 类型适用于您正在处理的所有数据?

如果需要不同的类型,我会考虑将所有不同的 IntVal、FloatVal、DoubleVal... 列放入一个表中。您的表定义可能类似于:

Variables
      ID          NOT NULL
     ,Name        NOT NULL
     ,DataType    NOT NULL CHECK (DataType IN ('INT','FLOAT','DOUBLE','TEXT'))  
   ,CONSTRAINT PK_Variables PRIMARY KEY (ID)
   ,CONSTRAINT UQ_Variables_1 UNIQUE (Name)
   ,CONSTRAINT UQ_Variables_2 UNIQUE  (ID,DataType)

    Values
      IDvals      NOT NULL
     ,ID          NOT NULL
     ,DataType    NOT NULL CHECK (DataType IN ('INT','FLOAT','DOUBLE','TEXT'))
     ,IntVal      NULL
     ,FloatVal    NULL
     ,DoubleVal   NULL
     ,TextVal     NULL
   ,CONSTRAINT PK_Values PRIMARY KEY (IDvals)
   ,CONSTRAINT FK_Values_Variable FOREIGN KEY (ID,DataType) REFERENCES Variables(ID,DataType)
   ,CONSTRAINT CH_Values CHECK ( NOT(DataType <> 'INT'    AND IntVal     IS NOT NULL)  AND
                                 NOT(DataType <> 'FLOAT'  AND FloatVal   IS NOT NULL)  AND
                                 NOT(DataType <> 'DOUBLE' AND DoubleVal  IS NOT NULL)  AND
                                 NOT(DataType <> 'TEXT'   AND TextVal    IS NOT NULL)
                                )
可能需要对变量(ID,DataType)的 UNIQUE 约束(DBMS?)以允许您将其作为 FK 的主题; CHECK 约束确保只使用有效的数据类型,并且只能填充正确的值列; 在值和变量中包含 DataType 意味着可以使用 FK 和 CHECK 的组合来确保给定变量的所有值都具有相同的数据类型,而不必使用触发器或应用程序逻辑。

对表的查询看起来像:

SELECT v.name as Variable,
       COALESCE(cast(a.IntVal       as varchar(max)),
                cast(a.FloatVal     as varchar(max)),
                cast(a.DoubleVal    as varchar(max)),
                cast(a.TextVal      as varchar(max)),
                '') as Value
FROM 
Variables V
JOIN Values a on V.ID = a.ID AND v.DataType = a.DataType

这也可以用基于 Variable.DataType 的 CASE 来编写(可能更正确),用于选择相关列。

在一个表中包含所有值意味着数据库中的表/约束/索引更少,并且意味着扩展解决方案以保存新数据类型仅意味着向 Values 表添加新列(并修改约束)而不是添加新表。

【讨论】:

非常好的点。真正的问题是如何使用和更新数据库。根据用例所有类型的大表许多不同类型的小表可能是更好的选择。

以上是关于SQL 数据库存储不同类型的值(在单个字段中或模拟为单个字段)的主要内容,如果未能解决你的问题,请参考以下文章

如何用数据库表模拟“扩展类”?

如何在单个进程中模拟 SQL Server 中的死锁?

sql修改字段值的范围

加入相同的字段,不同的数据类型

具有变体数据类型的 SQL 数据库设计 [关闭]

SQL 创建一个临时表#tabletemp 里面有两个字段“cn”和“dt”分别用来存储另一个表的字段名和数据类型。