sql 在PostgreSQL中一目了然地探索数据集

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了sql 在PostgreSQL中一目了然地探索数据集相关的知识,希望对你有一定的参考价值。

-- chech how many rows in the dataset
-- 查看数据集记录总数
SELECT count(*) FROM <table name>;

-- select random rows
-- 随机返回若干条记录
-- https://gist.github.com/404hub/11f55753ac23dc876a6e70461672b470
SELECT select_expression
FROM table_name
TABLESAMPLE SYSTEM/BERNOULLI ( argument [, ...] )
-- SYSTEM sampling method does block/page level sampling; BERNOULLI sampling method does a sequential scan.

-- caltulating percentiles
-- 计算各百分位数
-- https://gist.github.com/404hub/bdf81448887359c97f565418157ed1d2
-- fast method using window function
select max(buckets.colume_name), ntile as percentile
from(
    select colume_of_table, ntile(percentile_num_you_want)
    over (order by colume_of_table)
    from table_name
    ) as buckets
group by 2
order by 2

以上是关于sql 在PostgreSQL中一目了然地探索数据集的主要内容,如果未能解决你的问题,请参考以下文章

荐书:《PostgreSQL指南:内幕探索》| 留言送书

如何使用 Java 在 PostgreSQL 中安全地转义 SQL 的任意字符串

探索GaussDB(DWS)的过程化SQL语言能力

探索GaussDB(DWS)的过程化SQL语言能力

拯救DBA!美团SQL解析探索实践

PostgreSQL优化器入门: