SQL数据库中的维度和单元分析
Posted
技术标签:
【中文标题】SQL数据库中的维度和单元分析【英文标题】:dimensional and unit analysis in SQL database 【发布时间】:2010-11-16 12:32:15 【问题描述】:问题:
存储各种测量值的时间序列数据的关系数据库 (Postgres)。每个测量值都可以具有特定的“测量类型”(例如温度、溶解氧等),并且可以具有特定的“测量单位”(例如华氏/摄氏度/开尔文、百分比/毫克/升等)。
问题:
有没有人建立一个类似的数据库来保存维度完整性?有什么建议吗?
我正在考虑构建一个measurement_type 和一个measurement_unit 表,这两个表都有文本两列,ID 和文本。然后我会在measured_value 表中为这些表创建外键。文本让我有些担心,因为可能存在非唯一重复项(例如,“ug/l”与“µg/l”代表每升微克)。
这样做的目的是让我可以在查询中或通过外部编程转换和验证单位。理想情况下,我以后有能力进行严格的尺寸分析(例如,将 µg/l 与值“M/V”(质量除以体积)联系起来)。
有没有更优雅的方法来实现这一点?
【问题讨论】:
【参考方案1】:很久以前,我制作了一个用于处理单元的数据库子模式(好吧,我稍微夸大了一点;不过那是大约 20 年前的事了)。幸运的是,它只需要处理简单的质量、长度、时间维度——而不是温度、电流或光度等。而游戏的货币方面则不那么简单——在一种货币之间转换有无数种不同的方式另一个取决于转换率有效的日期、货币和期间。这是与物理单元分开处理的。
从根本上说,我创建了一个“度量”表,其中包含“id”列、单位名称、缩写和一组维度指数——质量、长度和时间各一个。这将填充诸如“体积”(长度 = 3、质量 = 0、时间 = 0)、“密度”(长度 = 3、质量 = -1、时间 = 0)之类的名称。
还有第二个单位表,它标识了一个度量,然后是特定度量使用的实际单位。例如,有桶、立方米,以及各种其他相关单位。
第三个表格定义了特定单位之间的换算系数。这包括两个单元和将单元 1 转换为单元 2 的乘法转换因子。这里最大的问题是转换因子的动态范围。如果从 U1 到 U2 的转换是 1.234E+10,那么倒数是一个很小的数字(8.103727714749e-11)。
S.Lott 关于温度的评论很有趣——我们不必处理这些。存储过程可以解决这个问题 - 尽管将一个存储过程集成到系统中可能会很棘手。
我描述的方案允许对大多数转换进行一次描述(包括假设单位,例如每两周弗隆,或不太假设但同样模糊的单位 - 在美国以外 - 如英亩-英尺),并且可以验证转换(对于例如,转换系数表中的两个单位必须具有相同的度量)。它可以扩展到处理大多数其他单位——尽管角度(或立体角)等无量纲单位存在一些有趣的问题。有支持代码可以处理任意转换 - 或在无法支持转换时生成错误。使用该系统的一个原因是,各个国际附属公司将在当地方便的单位报告他们的数据,但总部系统必须接受原始数据,并以适合经理人的单位呈现结果汇总数据——其中不同的经理人各自对于报告的最佳单位,他们有自己的想法(基于他们的国家背景和在总部的工作年限)。
【讨论】:
【参考方案2】:“文本让我有些担心,因为可能存在非唯一重复”
没错。所以不要使用文本作为键。使用 ID 作为键。
“有没有更优雅的方法来完成这个?”
不是真的。这个很难(硬。温度是它自己的问题,因为温度本身就是一个平均值,不像距离那样求和;加上 F 到 C 的转换不是乘法(因为它与所有其他单位转换一样。)
【讨论】:
【参考方案3】:关于转换的说明:很多单位是线性相关的,可以使用“y = A + Bx”之类的公式进行转换,其中 A 和 B 是可以存储在数据库中的每对单位的常数您需要在两者之间进行转换。例如,摄氏到华氏的常数为 A=32,B=1.8。
但是,也有极少数例外。例如,在对数和非对数单位之间进行转换。或者在每体积质量和每体积摩尔质量之间进行转换(在这种情况下,您需要知道被测化合物的摩尔质量)。
当然,如果您确定系统所需的所有转换都是线性的,那么就没有必要过度设计,只需存储两个常量即可。然后,您可以使用带有计算字段的直接 SQL 连接从数据库中提取标准化结果。
【讨论】:
以上是关于SQL数据库中的维度和单元分析的主要内容,如果未能解决你的问题,请参考以下文章