openGauss实战4数据类型解读
Posted IT邦德
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了openGauss实战4数据类型解读相关的知识,希望对你有一定的参考价值。
📢📢📢📣📣📣
哈喽!大家好,我是【IT邦德】,江湖人称jeames007,10余年DBA工作经验
一位上进心十足的【大数据领域博主】!😜😜😜
中国DBA联盟(ACDU)成员,目前从事DBA及程序编程
擅长主流数据Oracle、mysql、PG 运维开发,备份恢复,安装迁移,性能优化、故障应急处理等。
✨ 如果有对【数据库】感兴趣的【小可爱】,欢迎关注【IT邦德】💞💞💞
❤️❤️❤️感谢各位大可爱小可爱!❤️❤️❤️
文章目录
前言
本篇介绍了openGauss的数据类型及应用📣 1.数值类型
✨ 1.1 整数类型
名称 | 描述 | 存储空间 | 范围 |
---|---|---|---|
TINYINT | 微整数,别名为INT1 | 1字节 | 0 ~ 255 |
SMALLINT | 小范围整数,别名为INT2 | 2字节 | -32,768 ~ +32,767 |
INTEGER | 常用的整数,别名为INT4 | 4字节 | -2,147,483,648 ~ +2,147,483,647 |
BINARY_INTEGER | 常用的整数INTEGER的别名 | 4字节 | -2,147,483,648 ~ +2,147,483,647 |
BIGINT | 大范围的整数,别名为INT8 | 8字节 | -9,223,372,036,854,775,808 ~ +9,223,372,036,854,775,807 |
✨ 1.2 任意精度型
名称 | 描述 | 存储空间 | 范围 |
---|---|---|---|
NUMERIC[(p[,s])], DECIMAL[(p[,s])] | 精度p取值范围为[1,1000],标度s取值范围为[0,p]。 说明: p为总位数,s为小数位数。 | 用户声明精度 | 未指定精度的情况下,小数点前最大131,072位, 小数点后最大16,383位 |
NUMBER[(p[,s])] | NUMERIC类型的别名 | 用户声明精度 | 未指定精度的情况下,小数点前最大131,072位, 小数点后最大16,383位 |
✨ 1.3 序列整型
SMALLSERIAL | 描述 | 存储空间 | 范围 |
---|---|---|---|
SMALLSERIAL | 二字节序列整型 | 2字节 | -32,768 ~ +32,767 |
SERIAL | 四字节序列整型 | 4字节 | -2,147,483,648 ~ +2,147,483,647 |
BIGSERIAL | 八字节序列整型 | 8字节 | -9,223,372,036,854,775,808 ~ +9,223,372,036,854,775,807 |
LARGESERIAL | 十六字节序列整型 | 16字节 | -170,141,183,460,469,231,731,687,303,715,884,105,728 ~ +170,141,183,460,469,231,731,687,303,715,884,105,727 |
案例说明:
test=# CREATE TABLE smallserial_tab(a SMALLSERIAL);
–插入数据。
openGauss=# INSERT INTO smallserial_tab VALUES(default);
–再次插入数据。
openGauss=# INSERT INTO smallserial_tab VALUES(default);
test=# INSERT INTO smallserial_tab VALUES(8);
test=# INSERT INTO smallserial_tab VALUES(default);
✨ 1.4 浮点类型
名称 | 描述 | 存储空间 | 范围 |
---|---|---|---|
REAL,FLOAT4 | 单精度浮点数,不精准 | 4字节 | -3.402E+38~3.402E+38,6位十进制数字精度 |
DOUBLE PRECISION,FLOAT8 | 浮点数,不精准。精度p取值范围为[1,53] 说明:p为精度,表示总位数 | 4字节或8字节 | -1.79E+308~1.79E+308,15位十进制数字精度 |
FLOAT[§] | 常用的整数,别名为INT4 | 4字节 | -2,147,483,648 ~ +2,147,483,647 |
BINARY_DOUBLE | 是DOUBLE PRECISION的别名 | 8字节 | -1.79E+308~1.79E+308,15位十进制数字精度 |
DEC[(p[,s])] | 精度p取值范围为[1,1000],标度s取值范围为[0,p]。 说明:p为总位数,s为小数位位数。 | – | 未指定精度的情况下,小数点前最大131,072位, 小数点后最大16,383位。 |
INTEGER[(p[,s])] | 精度p取值范围为[1,1000],标度s取值范围为[0,p] | 4字节 | -2,147,483,648 ~ +2,147,483,647 |
📣 2. 布尔类型
名称 | 描述 | 存储空间 | 范围 |
---|---|---|---|
BOOLEAN | 布尔类型 | 1字节 | true:真 false:假 null:未知(unknown) |
📣 3. 字符类型
SMALLSERIAL | 描述 | 存储空间 | 范围 |
---|---|---|---|
CHAR(n) CHARACTER(n) NCHAR(n) | 定长字符串,不足补空格。n是指字节长度,如不带精度n,默认精度为1 | 最大为10MB。 | – |
VARCHAR(n) CHARACTER VARYING(n) | 变长字符串。n是指字节长度 | 最大为10MB | – |
VARCHAR2(n) | 变长字符串。是VARCHAR(n)类型的别名。n是指字节长度 | 最大为10MB | – |
NVARCHAR2(n) | 变长字符串。n是指字符长度 | 最大为10MB | – |
TEXT | 变长字符串 | 最大为1GB-1 | – |
CLOB | 文本大对象,是TEXT类型的别名 | 最大为1GB-1 | – |
📣 4. 二进制类型
名称 | 描述 | 存储空间 | 范围 |
---|---|---|---|
BLOB | 二进制大对象 | 最大为1GB-8203字节 | - |
RAW | 变长的十六进制类型 | 最大为1GB-8203字节 | - |
BYTEA | 变长的二进制字符串 | 最大为1GB-8203字节 | - |
📣 5. 日期/时间类型
说明: 如果其他的数据库时间格式和openGauss的时间格式不一致,可通过修改配置参数DateStyle的值来保持一致。
名称 | 描述 | 存储空间 | 范围 |
---|---|---|---|
DATE | 日期和时间 | 4字节 | - |
TIME [§] [WITHOUT TIME ZONE] | 只用于一日内时间 p表示小数点后的精度,取值范围为0~6 | 8字节 | - |
TIME [§] [WITH TIME ZONE] | 只用于一日内时间,带时区 p表示小数点后的精度,取值范围为0~6 | 12字节 | - |
TIMESTAMP[§] [WITHOUT TIME ZONE] | 日期和时间 p表示小数点后的精度,取值范围为0~6 | 8字节 | - |
TIMESTAMP[§][WITH TIME ZONE] | 日期和时间,带时区。TIMESTAMP的别名为TIMESTAMPTZ p表示小数点后的精度,取值范围为0~6 | 8字节 | - |
SMALLDATETIME | 日期和时间,不带时区 精确到分钟,秒位大于等于30秒进一位 | 8字节 | - |
INTERVAL DAY (l) TO SECOND § | 时间间隔,X天X小时X分X秒 l:天数的精度,取值范围为06<br>p:秒数的精度,取值范围为06 | 16字节 | - |
INTERVAL [FIELDS] [ § ] | 时间间隔 fields:可以是YEAR,MONTH,DAY,HOUR,MINUTE,SECOND等 p:秒数的精度,取值范围为0~6,且fields为SECOND,DAY TO SECOND等 | 12字节 | - |
reltime | 相对时间间隔,格式为: X years X mons X days XX:XX:XX | 4字节 | - |
abstime | 日期和时间。格式为: YYYY-MM-DD hh:mm:ss+timezone | 4字节 | - |
案例示范:
1.date类型
openGauss=# CREATE TABLE date_type(coll date);
openGauss=# INSERT INTO date_type VALUES (date '01-14-2023');
openGauss=# select * from date_type;
coll
---------------------
2023-01-14 00:00:00
2.TIME/TIMESTAMP类型
openGauss=# CREATE TABLE time_type (da time without time zone ,dai time with time zone,dfgh timestamp without time zone,dfga timestamp with time zone, vbg smalldatetime);
openGauss=# INSERT INTO time_type VALUES ('21:21:22','21:21:22 pst','2022-12-12','2022-12-11 pst','2022-04-12 04:05:06');
openGauss=# select * from time_type;
da | dai | dfgh | dfga | vbg
----------+-------------+---------------------+------------------------+---------------------
21:21:22 | 21:21:22-08 | 2022-12-12 00:00:00 | 2022-12-11 16:00:00+08 | 2022-04-12 04:05:00
3.INTERVAL 类型
openGauss=# CREATE TABLE day_type_tab (a int,b INTERVAL DAY(3) TO SECOND (4));
openGauss=# INSERT INTO day_type_tab VALUES (1, INTERVAL '3' DAY);
openGauss=# select * from day_type_tab;
a | b
---+--------
1 | 3 days
openGauss=# CREATE TABLE year_type_tab(a int, b interval year (6));
openGauss=# INSERT INTO year_type_tab VALUES(1,interval '2' year);
openGauss=# SELECT * FROM year_type_tab;
a | b
---+---------
1 | 2 years
✨ 5.1 日期输入
系统支持按照日、月、年的顺序自定义日期输入。如果把DateStyle参数设置为MDY就按照“月-日-年”解析,设置为DMY就按照“日-月-年”解析,设置为YMD就按照“年-月-日”解析。
日期的文本输入需要加单引号包围,语法如下:
type [ ( p ) ] ‘value’
可选的精度声明中的p是一个整数,表示在秒域中小数部分的位数
--创建表。
openGauss=# CREATE TABLE date_type_tab(coll date);
--插入数据。
openGauss=# INSERT INTO date_type_tab VALUES (date '12-10-2022');
--查看数据。
openGauss=# SELECT * FROM date_type_tab;
coll
---------------------
2022-12-10 00:00:00
(1 row)
--查看日期格式。
openGauss=# SHOW datestyle;
DateStyle
-----------
ISO, MDY
(1 row)
--设置日期格式。
openGauss=# SET datestyle='YMD';
SET
--插入数据。
openGauss=# INSERT INTO date_type_tab VALUES(date '2022-12-11');
--查看数据。
openGauss=# SELECT * FROM date_type_tab;
coll
---------------------
2022-12-10 00:00:00
2022-12-11 00:00:00
(2 rows)
--删除表。
openGauss=# DROP TABLE date_type_tab;
✨ 5.2 时间段输入
reltime的输入方式可以采用任何合法的时间段文本格式,包括数字形式(含负数和小数)及时间形式,其中时间形式的输入支持SQL标准格式、ISO-8601格式、POSTGRES格式等。另外,文本输入需要加单引号。
--创建表。
openGauss=# CREATE TABLE reltime_type_tab(col1 character(30), col2 reltime);
--插入数据。
openGauss=# INSERT INTO reltime_type_tab VALUES ('90', '90');
openGauss=# INSERT INTO reltime_type_tab VALUES ('-366', '-366');
openGauss=# INSERT INTO reltime_type_tab VALUES ('1975.25', '1975.25');
openGauss=# INSERT INTO reltime_type_tab VALUES ('-2 YEARS +5 MONTHS 10 DAYS', '-2 YEARS +5 MONTHS 10 DAYS');
openGauss=# INSERT INTO reltime_type_tab VALUES ('30 DAYS 12:00:00', '30 DAYS 12:00:00');
openGauss=# INSERT INTO reltime_type_tab VALUES ('P-1.1Y10M', 'P-1.1Y10M');
--查看数据。
openGauss=# SELECT * FROM reltime_type_tab;
col1 | col2
--------------------------------+-------------------------------------
90 | 3 mons
-366 | -1 years -18:00:00
1975.25 | 5 years 4 mons 29 days
-2 YEARS +5 MONTHS 10 DAYS | -1 years -6 mons -25 days -06:00:00
30 DAYS 12:00:00 | 1 mon 12:00:00
P-1.1Y10M | -3 mons -5 days -06:00:00
--删除表。
openGauss=# DROP TABLE reltime_type_tab;
📣 6. 几何类型
名称 | 存储空间 | 说明 | 表现形式 |
---|---|---|---|
point | 16字节 | 平面中的点 | (x,y) |
lseg | 32字节 | (有限)线段 | ((x1,y1),(x2,y2)) |
box | 32字节 | 矩形 | ((x1,y1),(x2,y2)) |
path | 16+16n字节 | 闭合路径(与多边形类似) | ((x1,y1),…) |
path | 16+16n字节 | 开放路径 | [(x1,y1),…] |
polygon | 40+16n字节 | 多边形(与闭合路径相似) | ((x1,y1),…) |
circle | 24 字节 | 圆 | <(x,y),r> (圆心和半径) |
openGauss提供了一系列的函数和操作符用来进行各种几何计算,如拉伸、转换、旋转、计算相交等。
📣 7. 网络地址类型
openGauss提供用于存储IPv4、IPv6、MAC地址的数据类型。
用这些数据类型存储网络地址比用纯文本类型好,因为这些类型提供输入错误检查和特殊的操作和功能。
名称 | 存储空间 | 说明 | 表现形式 |
---|---|---|---|
cidr | 7或19字节 | IPv4或IPv6网络 | 192.168.0.0/24 |
inet | 7或19字节 | IPv4或IPv6主机和网络 | address/y,address表示IPv4或者IPv6地址 y是子网掩码的二进制位数 |
macaddr | 6字节 | MAC地址 | ‘08:00:2b:01:02:03’ |
📣 8. 位串类型
位串就是一串1和0的字符串。它们可以用于存储位掩码。
openGauss支持两种位串类型:bit(n)和bit varying(n),这里的n是一个正整数。
bit类型的数据必须准确匹配长度n,如果存储短或者长的数据都会报错。
bit varying类型的数据是最长为n的变长类型,超过n的类型会被拒绝。一个没有长度的bit等效于bit(1),
没有长度的bit varying表示没有长度限制。
📣 9. 文本搜索类型
openGauss提供了两种数据类型用于支持全文检索。tsvector类型表示为文本搜索优化的文件格式,tsquery类型表示文本查询。
tsvector类型表示一个检索单元,通常是一个数据库表中一行的文本字段或者这些字段的组合,tsvector类型的值是一个标准词位的有序列表,标准词位就是把同一个词的变型体都标准化成相同的,在输入的同时会自动排序和消除重复。to_tsvector函数通常用于解析和标准化文档字符串。
✨ 9.1 tsvector
tsvector的值是唯一分词的分类列表,把一句话的词格式化为不同的词条,
在进行分词处理的时候tsvector会自动去掉分词中重复的词条,按照一定的顺序录入。如:
openGauss=# SELECT 'a fat cat sat on a mat and ate a fat rat'::tsvector;
tsvector
----------------------------------------------------
'a' 'and' 'ate' 'cat' 'fat' 'mat' 'on' 'rat' 'sat'
✨ 9.2 tsquery
tsquery类型表示一个检索条件,存储用于检索的词汇,并且使用布尔操作符&(AND),|(OR)和!(NOT)来组合他们,括号用来强调操作符的分组。to_tsquery函数及plainto_tsquery函数会将单词转换为tsquery类型前进行规范化处理。
openGauss=# SELECT 'fat & rat'::tsquery;
tsquery
---------------
'fat' & 'rat'
(1 row)
openGauss=# SELECT 'fat & (rat | cat)'::tsquery;
tsquery
---------------------------
'fat' & ( 'rat' | 'cat' )
(1 row)
openGauss=# SELECT 'fat & rat & ! cat'::tsquery;
tsquery
------------------------
'fat' & 'rat' & !'cat'
(1 row)
📣 10. UUID数据类型
UUID数据类型用来存储RFC 4122,ISO/IEF 9834-8:2005以及相关标准定义的通用唯一标识符(UUID)。这个标识符是一个由算法产生的128位标识符,确保它不可能使用相同算法在已知的模块中产生的相同标识符。
UUID是一个小写十六进制数字的序列,由分字符分成几组,一组8位数字+三组4位数字+一组12位数字,总共32个数字代表128位,标准的UUID示例如下:
a0eebc99-9c0b-4ef8-bb6d-6bb9bd380a11
openGauss同样支持以其他方式输入:大写字母和数字、由花括号包围的标准格式、省略部分或所有连字符、在任意一组四位数字之后加一个连字符。示例如下:
A0EEBC99-9C0B-4EF8-BB6D-6BB9BD380A11
a0eebc99-9c0b-4ef8-bb6d-6bb9bd380a11
a0eebc999c0b4ef8bb6d6bb9bd380a11
a0ee-bc99-9c0b-4ef8-bb6d-6bb9-bd38-0a11
📣 11. JSON/JSONB类型
JSON(javascript Object Notation)数据,可以是单独的一个标量,也可以是一个数组,也可以是一个键值对象,其中数组和对象可以统称容器(container):
标量(scalar):单一的数字、bool、string、null都可以叫做标量。
数组(array):[]结构,里面存放的元素可以是任意类型的JSON,并且不要求数组内所有元素都是同一类型。
对象(object):结构,存储key:value的键值对,其键只能是用“”包裹起来的字符串,值可以是任意类型的JSON,对于重复的键,按最后一个键值对为准。
openGauss内存在两种数据类型JSON和JSONB,可以用来存储JSON数据。其中JSON是对输入的字符串的完整拷贝,使用时再去解析,所以它会保留输入的空格、重复键以及顺序等;JSONB解析输入后保存的二进制,它在解析时会删除语义无关的细节和重复的键,对键值也会进行排序,使用时不用再次解析。
因此可以发现,两者其实都是JSON,它们接受相同的字符串作为输入。它们实际的主要差别是效率。JSON数据类型存储输入文本的精确拷贝,处理函数必须在每个执行上重新解析; 而JSONB数据以分解的二进制格式存储, 这使得它由于添加了转换机制而在输入上稍微慢些,但是在处理上明显更快, 因为不需要重新解析。同时由于JSONB类型存在解析后的格式归一化等操作,同等的语义下只会有一种格式,因此可以更好更强大的支持很多其他额外的操作,比如按照一定的规则进行大小比较等。JSONB也支持索引,这也是一个明显的优势。
输入必须是一个符合JSON数据格式的字符串,此字符串用单引号’’声明。
null(null-json):仅null,全小写。
select 'null'::json; -- sucselect 'NULL'::jsonb; -- err
数字(num-json):正负整数、小数、0,支持科学计数法。
select '1'::json;select '-1.5'::json;select '-1.5e-5'::jsonb, '-1.5e+2'::jsonb;select '001'::json, '+15'::json, 'NaN'::json;
布尔(bool-json):仅true、false,全小写。
select 'true'::json;select 'false'::jsonb;
字符串(str-json):必须是加双引号的字符串。
select '"a"'::json;select '"abc"'::jsonb;
数组(array-json):使用中括号[]包裹,满足数组书写条件。数组内元素类型可以是任意合法的JSON,且不要求类型一致。
select '[1, 2, "foo", null]'::json;select '[]'::json;select '[1, 2, "foo", null, [[]], ]'::jsonb;
对象(object-json):使用大括号包裹,键必须是满足JSON字符串规则的字符串,值可以是任意合法的JSON。
select ''::json;select '"a": 1, "b": "a": 2, "b": null'::json;select '"foo": [true, "bar"], "tags": "a": 1, "b": null'::jsonb;
📣 12. HLL数据类型
HLL(HyperLoglog)是统计数据集中唯一值个数的高效近似算法。它有着计算速度快,节省空间的特点,不需要直接存储集合本身,而是存储一种名为HLL的数据结构。每当有新数据加入进行统计时,只需要把数据经过哈希计算并插入到HLL中,最后根据HLL就可以得到结果。
-- 创建hll类型的表,不指定入参
openGauss=# create table t1 (id integer, set hll);
openGauss=# \\d t1
Table "public.t1"
Column | Type | Modifiers
--------+---------+-----------
c1 | integer |
c2 | hll |
-- 创建hll类型的表,指定前两个入参,后两个采用默认值
openGauss=# create table t2 (id integer, set hll(12,4));
Table "public.t2"
Column | Type | Modifiers
--------+----------------+-----------
c1 | integer |
c2 | hll(12,4,12,0) |
--创建hll类型的表,指定第三个入参,其余采用默认值
openGauss=# create table t3(id int, set hll(-1,-1,8,-1));
openGauss=# \\d t3
Table "public.t3"
Column | Type | Modifiers
--------+----------------+-----------
c1 | integer |
c2 | hll(14,10,8,0) |
--创建hll类型的表,指定入参不合法报错
openGauss=# create table t4(id int, set hll(5,-1));
ERROR: log2m = 5 is out of range, it should be in range 10 to 16, or set -1 as default
📣 13. 范围类型
范围类型是表达某种元素类型(称为范围的_subtype_)的一个值的范围的数据类型。例如,timestamp的范围可以被用来表达一个会议室被保留的时间范围。在这种情况下,数据类型是tsrange(“timestamp range”的简写)而timestamp是 subtype。subtype 必须具有一种总体的顺序,这样对于元素值是在一个范围值之内、之前或之后就是界线清楚的。
范围类型非常有用,因为它们可以表达一种单一范围值中的多个元素值,并且可以很清晰地表达诸如范围重叠等概念。用于时间安排的时间和日期范围是最清晰的例子;但是价格范围、一种仪器的量程等等也都有用。
📣 14.XML类型
openGauss支持XML类型,使用示例如下。
openGauss= CREATE TABLE xmltest ( id int, data xml );
openGauss= INSERT INTO xmltest VALUES (1, 'one');
openGauss= INSERT INTO xmltest VALUES (2, 'two');
openGauss= SELECT * FROM xmltest ORDER BY 1;
id | data
----+--------------------
1 | one
2 | two
(2 rows)
openGauss= SELECT xmlconcat('', NULL, '');
xmlconcat
(1 row)
openGauss= SELECT xmlconcat('', NULL, '');
xmlconcat
(1 row)
openGauss数据库之SQL介绍
目录
一、什么是SQL?
1、SQL的概念
2、SQL的特点
3、SQL发展简史
二、openGauss数据库的“SQL”
1、数据类型(常用)
数值类型
货币类型
布尔类型
字符类型
日期/时间类型
2、openGauss数据库SQL基本语法
创建用户(CREATE USER)
创建和管理数据库
创建表(CREATE TABLE)
向表中插入数据
更新表中数据
查看数据
删除表中数据
三、参考资料
一、什么是SQL?
1、SQL的概念
结构化查询语言(SQL)是用于访问和处理关系型数据库的标准计算机语言。
SQL提供了各种任务的语句,包括:
- 查询数据。
- 在表中插入,更新和删除行。
- 创建,替换,更改和删除对象。
- 控制对数据库及其对象的访问。
- 保证数据库的一致性和完整性。
SQL语言由用于处理数据库和数据库对象的命令和函数组成:
- DDL(data definition language)数据定义语言,用户定义和管理sql数据库中所有对象的语言。 主要命令:create、alter、drop等
- DML(data manipulation language)数据操作语言。 主要命令:select、update、insert、delete等
- DCL(date control language)数据库控制功能。主要命令:grant、deny、revoke、commit、savepoint、rollback等
2、SQL的特点
- SQL语言集数据查询、数据操纵、数据定义和数据控制功能于一体
- 面向集合的语言
- 非过程语言
- 类似自然语言,简洁易用
- 自含式语言,又是嵌入式语言。可独立使用,也可嵌入到宿主语言中。
3、SQL发展简史
SQL发展简史如下:
- 1986年,ANSI X3.135-1986,ISO/IEC 9075:1986,SQL-86
- 1989年,ANSI X3.135-1989,ISO/IEC 9075:1989,SQL-89
- 1992年,ANSI X3.135-1992,ISO/IEC 9075:1992,SQL-92(SQL2)
- 1999年,ISO/IEC 9075:1999,SQL:1999(SQL3)
- 2003年,ISO/IEC 9075:2003,SQL:2003(SQL4)
- 2011年,ISO/IEC 9075:200N,SQL:2011(SQL5)
//注:
ANSI是美国国家标准学会(American National Standards Institute)的英文简称,成立于1918年。
ISO:国际标准化组织(International Organization for Standardization)。
IEC:国际电工委员会(International Electrotechnical Commission)。
//
二、openGauss数据库的“SQL”
openGauss数据库支持的SQL标准,默认支持SQL2、SQL3和SQL4的主要特性。当然了, 一般说到数据库的SQL语句,就离不开两个方面: 一是数据类型,二是sql语句基本语法。下文就此简单阐述一下:
1、数据类型(常用)
openGauss数据库支持的数据类型涵盖非常广, 几乎包含所有形式的数据类型,如:数值类型、货币类型、布尔类型、字符类型、二进制类型、日期/时间类型、几何类型、网络地址类型、位串类型、文本搜索类型、UUID类型、JSON/JSONB类型、HLL数据类型、范围类型、对象标识符类型、伪类型、列存表支持的数据类型、XML类型、账本数据库使用的数据类型等。 但是实际业务场景中大部分类型用到的比较少,具体遇到时可参考官方文档说明。
下文参考并整理了日常应用开发中常用的主要数据类型,主要包含:数值类型、货币类型、布尔类型、字符类型、日期/时间类型等。
数值类型
表1:整数数据类型
名称 | 描述 | 存储空间 | 范围 |
TINYINT | 微整数,别名为INT1。 | 1字节 | 0 ~ 255 |
SMALLINT | 小范围整数,别名为INT2。 | 2字节 | -32,768 ~ +32,767 |
INTEGER | 常用的整数,别名为INT4 / BINARY_INTEGER。 | 4字节 | -2,147,483,648 ~ +2,147,483,647 |
BIGINT | 大范围的整数,别名为INT8。 | 8字节 | -9,223,372,036,854,775,808 ~ +9,223,372,036,854,775,807 |
int16 | 十六字节的大范围证书,目前不支持用户用于建表等使用。 | 16字节 | -170,141,183,460,469,231,731,687,303,715,884,105,728 ~ +170,141,183,460,469,231,731,687,303,715,884,105,727 |
说明:TINYINT、SMALLINT、INTEGER、BIGINT和INT16类型存储各种范围的数字,也就是整数。试图存储超出范围以外的数值将会导致错误。
常用的类型是INTEGER,因为它提供了在范围、存储空间、性能之间的最佳平衡。一般只有取值范围确定不超过SMALLINT的情况下,才会使用SMALLINT类型。而只有在INTEGER的范围不够的时候才使用BIGINT,因为前者相对快得多。
表2:任意精度型
名称 | 描述 | 存储空间 | 范围 |
NUMERIC[(p[,s])], DECIMAL[(p[,s])] | 精度p取值范围为[1,1000],标度s取值范围为[0,p]。 说明: p为总位数,s为小数位数。 | 用户声明精度。每四位(十进制位)占用两个字节,然后在整个数据上加上八个字节的额外开销。 | 未指定精度的情况下,小数点前最大131,072位,小数点后最大16,383位。 |
NUMBER[(p[,s])] | NUMERIC类型的别名。 | 用户声明精度。每四位(十进制位)占用两个字节,然后在整个数据上加上八个字节的额外开销。 | 未指定精度的情况下,小数点前最大131,072位,小数点后最大16,383位。 |
说明:与整数类型相比,任意精度类型需要更大的存储空间,其存储效率、运算效率以及压缩比效果都要差一些。在进行数值类型定义时,优先选择整数类型。当且仅当数值超出整数可表示最大范围时,再选用任意精度类型。
使用Numeric/Decimal进行列定义时,建议指定该列的精度p以及标度s。
表3:序列整型
名称 | 描述 | 存储空间 | 范围 |
SMALLSERIAL | 二字节序列整型。 | 2字节 | -32,768 ~ +32,767 |
SERIAL | 四字节序列整型。 | 4字节 | -2,147,483,648 ~ +2,147,483,647 |
BIGSERIAL | 八字节序列整型。 | 8字节 | -9,223,372,036,854,775,808 ~ +9,223,372,036,854,775,807 |
LARGESERIAL | 默认插入十六字节序列整形,实际数值类型和numeric相同。 | 变长类型,每四位(十进制位)占用两个字节,然后在整个数据上加上八个字节的额外开销。 | 小数点前最大131,072位,小数点后最大16,383位。 |
说明:SMALLSERIAL、SERIAL、BIGSERIAL和LARGESERIAL类型不是真正的类型,只是为在表中设置唯一标识做的概念上的便利。因此,创建一个整数字段,并且把它的缺省数值安排为从一个序列发生器读取。应用了一个NOT NULL约束以确保NULL不会被插入。在大多数情况下用户可能还希望附加一个UNIQUE或PRIMARY KEY约束避免意外地插入重复的数值,但这个不是自动的。最后,将序列发生器从属于那个字段,这样当该字段或表被删除的时候也一并删除它。目前只支持在创建表时候指定SERIAL列,不可以在已有的表中,增加SERIAL列。另外临时表也不支持创建SERIAL列。因为SERIAL不是真正的类型,也不可以将表中存在的列类型转化为SERIAL。
表4:浮点类型
名称 | 描述 | 存储空间 | 范围 |
REAL, FLOAT4 | 单精度浮点数,不精准。 | 4字节 | -3.402E+38~3.402E+38,6位十进制数字精度。 |
DOUBLE PRECISION, FLOAT8 | 双精度浮点数,不精准。 | 8字节 | -1.79E+308~1.79E+308,15位十进制数字精度。 |
FLOAT[(p)] | 浮点数,不精准。精度p取值范围为[1,53]。 说明: p为精度,表示总位数。 | 4字节或8字节 | 根据精度p不同选择REAL或DOUBLE PRECISION作为内部表示。如不指定精度,内部用DOUBLE PRECISION表示。 |
BINARY_DOUBLE | 是DOUBLE PRECISION的别名。 | 8字节 | -1.79E+308~1.79E+308,15位十进制数字精度。 |
DEC[(p[,s])] | 精度p取值范围为[1,1000],标度s取值范围为[0,p]。 说明: p为总位数,s为小数位位数。 | 用户声明精度。每四位(十进制位)占用两个字节,然后在整个数据上加上八个字节的额外开销。 | 未指定精度的情况下,小数点前最大131,072位,小数点后最大16,383位。 |
INTEGER[(p[,s])] | 精度p取值范围为[1,1000],标度s取值范围为[0,p]。 | 用户声明精度。每四位(十进制位)占用两个字节,然后在整个数据上加上八个字节的额外开销。 | - |
货币类型
货币类型存储带有固定小数精度的货币金额
名称 | 存储容量 | 描述 | 范围 |
money | 8 字节 | 货币金额 | -92233720368547758.08 到 +92233720368547758.07 |
布尔类型
名称 | 描述 | 存储空间 | 取值 |
BOOLEAN | 布尔类型 | 1字节。 |
|
说明:“真”值的有效文本值是:TRUE、t、true、y、yes、1 、TRUE、true、整数范围内12^63-1、整数范围内-1-2^63。“假”值的有效文本值是:FALSE、f、false、n、no、0、0、FALSE、false。
使用TRUE和FALSE是比较规范的用法(也是SQL兼容的用法)。
字符类型
名称 | 描述 | 存储空间 |
CHAR(n) CHARACTER(n) NCHAR(n) | 定长字符串,不足补空格。n是指字节长度,如不带精度n,默认精度为1。 | 最大为10MB。 |
VARCHAR(n) CHARACTER VARYING(n) | 变长字符串。PG兼容模式下,n是字符长度。其他兼容模式下,n是指字节长度。 | 最大为10MB。 |
VARCHAR2(n) | 变长字符串。是VARCHAR(n)类型的别名。n是指字节长度。 | 最大为10MB。 |
NVARCHAR2(n) | 变长字符串。n是指字符长度。 | 最大为10MB。 |
NVARCHAR(n) | 变长字符串。是NVARCHAR2(n)类型的别名。n是指字符长度。 | 最大为10MB。 |
TEXT | 变长字符串。 | 最大为1GB-1,但还需要考虑到列描述头信息的大小, 以及列所在元组的大小限制(也小于1GB-1),因此TEXT类型最大大小可能小于1GB-1。 |
CLOB | 文本大对象。是TEXT类型的别名。 | 最大为1GB-1,但还需要考虑到列描述头信息的大小, 以及列所在元组的大小限制(也小于1GB-1),因此CLOB类型最大大小可能小于1GB-1。 |
日期/时间类型
名称 | 描述 | 存储空间 |
DATE | 日期和时间。 | 4字节(兼容模式A下存储空间大小为8字节) |
TIME [(p)] [WITHOUT TIME ZONE] | openGauss 5.0企业版主从部署,实战狂飙
openGauss一种可能是目前最快的从ORACLE同步数据到MogDB(openGauss)的方式 |