基于PostgreSQL的时序数据库TimescaleDB

Posted PostgreSQLChina

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于PostgreSQL的时序数据库TimescaleDB相关的知识,希望对你有一定的参考价值。

作者:杭州美创科技有限公司

什么是时序数据库?顾名思义,用于处理按照时间变化顺序的数据的数据库即为时序数据库(time-series database),时序数据库专门优化处理带时间标签的数据,为什么会衍生时序数据库这一种新趋势呢?我们知道像PostgreSQL和mysql这种关系型数据库对于短期需求不大的情况下下还是可以满足的,但是一旦数据量增长,其性能不足以支持频繁的添加和读取需求。运用时间模型来构造的应用非常需要时序数据库的加持,包括未来大数据的趋势,时序数据库必然会成为一个新潮流。

今天的主角TimescaleDB在DB-Engines中排名的处于第5位,并一直处于上升的趋势,其中不乏PostgreSQL的占有率提高而导致其增长的一部分原因,因为本质上它是PostgreSQL的一个插件,除了其本身丰富强大的功能外,TimescaleDB完全支持SQL且拥有PostgreSQL的丰富生态。

TimescaleDB是目前市面上唯一一款开源的时间序列数据库,且完全支持SQL。官方称之为“Full SQL”,它像传统的关系数据库一样易于使用,并且可以按以前为NoSQL数据库保留的方式进行扩展。

它依赖于PostgreSQL,拥有坚如磐石的可靠性以及最大量级的开发人员、管理工具和生态系统。其包含以下特性和优点:

  • 完整的SQL以及强大的分析功能,没有限制
  • 以PostgreSQL扩展的方式安装,支持已有的PostgreSQL特性
  • 拥有高基数的工作负载
  • 基于时序优化
  • 自动分片(自动按时间、空间分片(chunk))
  • 写入能力强大,每秒写入百万级的数据点
  • 支持多个SERVER,多个CHUNK的并行查询
  • 简化堆栈并将关系数据与时间序列数据一起存储
  • 支持自动的按时间保留策略

对于TimescaleDB来说,在功能的丰富程度上战胜了排名更靠前的几位选手,但是对于性能上可能处于下风,因此TimescaleDB如何持续地发展下去、如何发展地更好,除了探寻在性能等综合素质方面的提升外,在PostgreSQL的肩膀上怎么样更好地适应现代化需求才是重中之重。

接下来介绍一下如何安装并使用TimescaleDB

一、前期准备:

操作系统环境:CentOS Linux release 7.4.1708(Core)
Cmake编译环境:需要3.4以上,本实验环境使用最新版本3.21.2
PostgreSQL软件:支持PostgreSQL 9.6.3 +,10.9 +或11.4 +,本实验环境使用12.2

二、安装或升级你的Cmake版本:

卸载原有的旧版本

# yum remove cmake -y

进入cmake的官网下载对应版本的软件包:https://cmake.org/download/

这里我们直接下载3.21.2版本的二进制软件包

# wget https://github.com/Kitware/CMake/releases/download/v3.21.2/cmake-3.21.2-linux-x86_64.tar.gz

解压软件包

# tar xzvf cmake-3.21.2-linux-x86_64.tar.gz

进入解压后的目录,将bin/目录下的cmake做软链接,当然也可以直接将cmake添加到环境变量中

# ln -s /root/cmake-3.21.2-linux-x86_64/bin/cmake /usr/bin/cmake

检查cmake是否可用

# cmake --version
cmake version 3.21.2
CMake suite maintained and supported by Kitware (kitware.com/cmake).

三、编译安装TimescaleDB软件:

从github中下载软件

https://github.com/timescale/timescaledb

解压软件包,进入解压目录,进行编译安装

如果在编译安装PostgreSQL软件的时候没有选择安装openssl,那么可以使用

/bootstrap -BUSE_OPENSSL=0进行安装,如果有选择安装openssl,就去掉参数选项,直接进行安装

# ./bootstrap && make && make install

四、配置PostgreSQL:

在postgresql.conf配置文件中修改

$ vim postgresql.conf
shared_preload_libraries = 'timescaledb'

重启数据库服务

创建一个时序数据库

$ psql
psql (12.2)
Type "help" for help.
postgres=# create database tsdb;
CREATE DATABASE
postgres=# \\c tsdb -
You are now connected to database "tsdb" as user "postgres".
tsdb=# create extension timescaledb ;

到此为止,就完成了TimescaleDB的安装步骤,可以看到得益于扩展形式的存在,安装变得非常简便,并且随着PostgreSQL软件的更新,整个基于PostgreSQL软件的TimescaleDB时序数据库也在同步更新。

五、如何使用TimescaleDB:

使用TimescaleDB库,其实就多了一步转换为超表的步骤,其它基本和操作普通的表一样

创建标准表

CREATE TABLE conditions (
  time        TIMESTAMPTZ       NOT NULL,
  location    TEXT              NOT NULL,
  temperature DOUBLE PRECISION  NULL,
  humidity    DOUBLE PRECISION  NULL
);

以时间字段作为分片字段,将标准表转换为超表

SELECT create_hypertable('conditions', 'time');

在超表中进行插入和查询操作

INSERT INTO conditions(time, location, temperature, humidity)
  VALUES (NOW(), 'office', 70.0, 50.0);
 
SELECT * FROM conditions ORDER BY time DESC LIMIT 100;

以上是关于基于PostgreSQL的时序数据库TimescaleDB的主要内容,如果未能解决你的问题,请参考以下文章

基于PostgreSQL的时序数据库TimescaleDB(下)

几个时序数据库

几个时序数据库

[转帖]几个时序数据库

Centos7 安装 PostgreSql 14 数据库 和 timescaledb 时序库

阿里云RDS PostgreSQL时序数据的优化